У меня есть постановка проблемы, и мне нужно знать, можно ли ее решить с помощью машинного обучения или нет. Это звучит так: -
У меня есть система, в которой пользователь может загружать документы, поэтому предположим, что у нас есть файл с именем xxxZxxx.xxx
Пользователь переходит на несколько уровней в структуру папок системы и помещает файл (скажем) A / B / C / D / Z / xxxZxxx.xxx
Нам необходимо создать систему, которая считывает имя файла и предлагает путь, по которому он должен быть помещен.
В этом случае имя файла содержит последнюю часть пути, которая является каталогом бизнес-объекта, но может не содержать. У нас такие пути и документы в порядке 10 ^ 5.
И новые пути, то есть бизнес-объекты, могут добавляться со временем, что делает эту классификацию мультиклассовой с примерно 10 ^ 5 классами, которые продолжают увеличиваться
Это разрешимо?
Я попытался использовать набор символов (на основе набора слов) в качестве вектора признаков, но безуспешно.
Какие-либо комментарии по поводу любого подхода, который можно использовать для этого? Сообщите мне, если потребуется какая-либо другая информация, я отредактирую вопрос или изменю теги.