моделирование темы молотка: как деактивировать строчные буквы?

Я провожу эксперимент по моделированию тем с Маллетом на немецких текстах. Поскольку немецкие существительные начинаются с прописной буквы, я хочу сохранить эту функцию. Кто-нибудь знает, как отключить нижний регистр?


person eric24629    schedule 14.10.2018    source источник


Ответы (1)


Добавьте --preserve-case при импорте документов.

person David Mimno    schedule 24.10.2018