У меня проблема с выбором повторяющихся строк в R. База данных имеет 14 столбцов и 1 миллион строк. Мне нужно выполнить сравнение строк, т.е. найти идентичные строки, которые будут дублироваться. Я хочу получить повторяющуюся строку этим методом. Мой фрейм данных похож на образец фрейма данных
Последние две строки были идентичными, поэтому нужно пометить их как значение флага 1. Я не знаю, как начать с этого.
Я пробовал эти коды,
df <- unique(data[,1:97]) //this method gives me unique set not number of duplicates.
dim(data[duplicated(data),])[1] // this method gives me the number of duplicates but not ids.
Мне нужно знать повторяющиеся идентификаторы.
мое намерение состоит в том, чтобы проверить каждую строку и записать общее количество повторяющихся строк или номер строки.