Я хочу использовать стеммер литовского языка в Python, однако литовский язык отсутствует в распространенных инструментах, таких как NLTK. а>.
Однако я смог найти файлы Snowball .sbl литовских стеммеров здесь и здесь.
Но как их использовать в Python?
Что мне удалось найти, так это подход командной строки для получения файлов .c. Но что дальше?
Как указано на официальной странице, существует PyStemmer — интерфейс Python для Snowball. Но там я не смог найти способа использовать новые или пользовательские алгоритмы .sbl.
Итак, как получить новый алгоритм .sbl для Python?