Я пытался реализовать процедуру классификации текста, используя пакет tensorflow в python. У меня уже была успешная версия персептрона, работающая в среде scikit-learn, но scikit-learn не имеет многослойных нейронных сетей (за исключением какой-то мифической версии 0.18, которую я нигде не могу найти/установить).
Я подумал, что лучше сначала попробовать что-то более простое в tensorflow, чтобы узнать, как работает пакет и что он может и чего не может делать, поэтому я пошел с ближайшими соседями. Пока все хорошо, за исключением того, что я просто не могу найти способ скормить разреженную версию словарной матрицы (векторизация текстов с помощью мешков слов) заполнителю в тензорном потоке (в scikit-learn это не проблема вообще ). Преобразование словарной матрицы в плотную матрицу решает проблему, но сильно замедляет работу алгоритма и забивает оперативную память.
Есть ли способ обойти это? Из того, что я нашел в Интернете, кажется, что тензорный поток имеет очень ограниченную поддержку разреженных объектов (только определенные операции будут принимать их в качестве входных данных), но я надеюсь, что ошибаюсь.
P.S. Да, я прочитал эту тему, и это не решило мою проблему. И да, я знаю, что могу придерживаться персептрона scikit-learn или выбрать другой пакет, но это решение, которое я приму на основе ответов, которые я здесь получу.