Я пытаюсь обрабатывать муниципальную информацию в R, и мне кажется, что это факторы (а точнее factor()
). лучший способ достичь моей цели. Я только начинаю разбираться в R, поэтому полагаю, что моя проблема, возможно, очень проста.
У меня есть следующий пример фрейма данных, которым я хочу поделиться (небольшая часть финских муниципалитетов):
municipality<-c("Espoo", "Oulu", "Tampere", "Joensuu", "Seinäjoki",
"Kerava")
region<-c("Uusimaa","Pohjois-Pohjanmaa","Pirkanmaa","Pohjois-Karjala","Etelä-Pohjanmaa","Uusimaa")
myData<-cbind(municipality,region)
myData<-as.data.frame(myData)
По умолчанию R преобразует мои символьные столбцы в коэффициенты, которые можно проверить с помощью str(myData)
. Теперь перейдем к той части, где заканчиваются мои навыки от новичка до новичка уровня R: похоже, я не могу найти способ применить факторы из столбца region
к столбцу municipality
.
Позвольте мне продемонстрировать. Вместо первоначального результата
as.numeric(factor(myData$municipality))
[1] 1 4 6 2 5 3
Я хотел бы получить это, факторы из региона myData $ применимы к муниципалитету myData $.
as.numeric(factor(myData$municipality))
[1] 5 4 2 3 1 5
Я приветствую любую помощь с распростертыми объятиями. Спасибо.
myData$municipality
в соответствии сas.numeric(myData$region)
? Если так, вы могли бы сделатьmyData$municipality[myData$region]
. Как отметил @jogo, вы можете / должны использоватьwith()
вместоattach()
, например.with(myData, municipality[region])
. - person markus   schedule 16.03.2018region
на уровне фактораmunicipality
, заменив исходный. Например,levels(myData$municipality)<-c(levels(myData$region))
не работает. Простите меня, часть проблемы здесь, похоже, заключается в том, что я не так хорошо знаком с разговорным языком R или любым другим языком программирования в этом отношении. - person Vesanen   schedule 16.03.2018