Допустим, у меня есть:
Person Movie Rating
Sally Titanic 4
Bill Titanic 4
Rob Titanic 4
Sue Cars 8
Alex Cars **9**
Bob Cars 8
Как видите, у Алекса есть противоречие. Все одни и те же фильмы должны иметь одинаковый рейтинг, но для Алекса была запись с ошибкой данных. Как я могу использовать R для решения этой проблемы? Я думал об этом некоторое время, но я не могу понять это. Мне нужно просто сделать это вручную в excel или что-то в этом роде? Есть ли в R команда, которая вернет все случаи противоречия данных между двумя столбцами?
Возможно, я мог бы заставить R выполнить логическую проверку, если все случаи Movie соответствуют первому рейтингу его первой итерации? Для всего, что возвращает «нет», я могу посмотреть это вручную? Как бы я написал эту функцию?
Спасибо
Rating
? Кроме того, вы всегда предполагаете, что большинство правы? - person David Arenburg   schedule 13.12.2014