Я хочу построить рекомендательную систему, используя правила ассоциации с априорным алгоритмом, реализованным в библиотеке mlxtend. В моих данных о продажах есть информация о 36 миллионах транзакций и 50 тысячах уникальных товаров. Я пытался использовать sklearn OneHotEncoder и pandas get_dummies(), но оба выдают ошибку OOM, поскольку не могут создать фрейм в форме (36 mil, 50k)
MemoryError: Unable to allocate 398. GiB for an array with shape (36113798, 50087) and data type uint8
Есть ли другое решение?