Выберите повторяющиеся строки, сравнив несколько столбцов в R [дубликаты]

У меня проблема с выбором повторяющихся строк в R. База данных имеет 14 столбцов и 1 миллион строк. Мне нужно выполнить сравнение строк, т.е. найти идентичные строки, которые будут дублироваться. Я хочу получить повторяющуюся строку этим методом. Мой фрейм данных похож на образец фрейма данных

Последние две строки были идентичными, поэтому нужно пометить их как значение флага 1. Я не знаю, как начать с этого.

Я пробовал эти коды,

df <- unique(data[,1:97]) //this method gives me unique set not number of duplicates.
dim(data[duplicated(data),])[1]  // this method gives me the number of duplicates but not ids.

Мне нужно знать повторяющиеся идентификаторы.

мое намерение состоит в том, чтобы проверить каждую строку и записать общее количество повторяющихся строк или номер строки.

r comparison rowcount

Sharmi 15.08.2018 источник

comment

@dww Я уже передал вопрос. Он может удалить определенные значения строки и столбца, но мне нужно сделать это для всей строки. Я связал в моем образце данных. - Sharmi 16.08.2018

Ответы (1)

arrow_upward
-1
arrow_downward

Посмотрите на функцию duplicated(). Его можно использовать для удаления повторяющихся строк или обратного сохранения их.

SmitM 15.08.2018

comment

Я применил функцию Duplicated() к моему набору, но она говорит false, даже существует повторяющаяся строка. - Sharmi; 16.08.2018

Выберите повторяющиеся строки, сравнив несколько столбцов в R [дубликаты]

Ответы (1)

Похожие вопросы