У меня есть база данных, в которой хранятся сведения о продуктах, взятых со многих сайтов и собранных через API отдельных сайтов. Когда я вызываю ленту, подробности сохраняются в таблице базы данных.
Проблема, с которой я столкнулся, заключается в том, что из-за того, что один и тот же продукт указан на многих сайтах продавцом, в моей базе данных появляются повторяющиеся элементы, а затем, когда я показываю их на веб-странице, появляется много дубликатов.
Проблема в том, что у товара нет очевидного уникального идентификатора, у него есть конкретные детали товара (которых может быть много), а затем описание товара от продавца.
Я бы хотел, чтобы элемент отображался один раз, а затем предоставлял пользователю подробную информацию о том, где еще этот элемент указан.
Как мне идентифицировать появившиеся дубликаты, не замедляя работу всей базы данных? Как бы мне тогда выбрать одно объявление из всех дубликатов, а затем сохранить, на каких еще сайтах оно отображается.
Спасибо за любую помощь.