Выберите повторяющиеся строки, сравнив несколько столбцов в R [дубликаты]

У меня проблема с выбором повторяющихся строк в R. База данных имеет 14 столбцов и 1 миллион строк. Мне нужно выполнить сравнение строк, т.е. найти идентичные строки, которые будут дублироваться. Я хочу получить повторяющуюся строку этим методом. Мой фрейм данных похож на образец фрейма данных

Последние две строки были идентичными, поэтому нужно пометить их как значение флага 1. Я не знаю, как начать с этого.

Я пробовал эти коды,

df <- unique(data[,1:97]) //this method gives me unique set not number of duplicates.
dim(data[duplicated(data),])[1]  // this method gives me the number of duplicates but not ids.

Мне нужно знать повторяющиеся идентификаторы.

мое намерение состоит в том, чтобы проверить каждую строку и записать общее количество повторяющихся строк или номер строки.


person Sharmi    schedule 15.08.2018    source источник
comment
@dww Я уже передал вопрос. Он может удалить определенные значения строки и столбца, но мне нужно сделать это для всей строки. Я связал в моем образце данных.   -  person Sharmi    schedule 16.08.2018


Ответы (1)


Посмотрите на функцию duplicated(). Его можно использовать для удаления повторяющихся строк или обратного сохранения их.

person SmitM    schedule 15.08.2018
comment
Я применил функцию Duplicated() к моему набору, но она говорит false, даже существует повторяющаяся строка. - person Sharmi; 16.08.2018