Заранее извиняюсь, если это несколько нубский вопрос, но я просмотрел форум и не смог найти способ поиска того, что я пытаюсь сделать. У меня есть тренировочный набор, и я пытаюсь найти способ уменьшить количество уровней, которые у меня есть для моих категориальных переменных (в приведенном ниже примере категорией является состояние). Я хотел бы сопоставить состояние со средним значением или скоростью уровня. Мой тренировочный набор будет выглядеть следующим образом после ввода во фрейм данных:
state class mean
1 CA 1 0
2 AZ 1 0
3 NY 0 0
4 CA 0 0
5 NY 0 0
6 AZ 0 0
7 AZ 1 0
8 AZ 0 0
9 CA 0 0
10 VA 1 0
Я хотел бы, чтобы третий столбец в моем фрейме данных был средним значением первого столбца (состояния) на основе переменной класса. поэтому среднее значение для строк CA будет 0,333 ... так что средний столбец можно использовать в качестве замены столбца состояния. Есть ли хороший способ сделать это без написания явного цикла в R?
Как можно отобразить новые уровни (например, новые состояния), если мой тренировочный набор их не включает? Любая ссылка на подходы в R будет принята с благодарностью.