Как я могу отключить регистрацию сообщений от тегера Stanford POS?

У меня есть около 4 миллионов текстов для аннотирования с помощью тегера Stanford POS. Как я могу отключить эти сообщения регистрации:

Reading POS tagger model from edu/stanford/nlp/models/pos-tagger/english-left3words/english-left3words-distsim.tagger ... done [1,1 sec].

Мне не нужно 4 миллиона из них в моих лог-файлах.


person Pete    schedule 23.08.2015    source источник
comment
Пожалуйста, смотрите мой ответ в другой теме stackoverflow.com/a/48743963/1303210   -  person FatalError    schedule 12.02.2018


Ответы (2)


StanfordNLP использует Redwood в качестве основы для ведения журнала. Вы должны отключить его перед инициализацией конвейера StanfordNLP.

import edu.stanford.nlp.util.logging.RedwoodConfiguration;
RedwoodConfiguration.current().clear().apply();
StanfordCoreNLP pipeline = new StanfordCoreNLP(props);

Меня устраивает. Он не показывает длинное сообщение INFO в каждой строке во время работы программы.

Ссылка: Руководство по настройке Redwood.

Надеюсь, поможет!

person Om Prakash    schedule 19.05.2017

Не могли бы вы предоставить мне более подробную информацию о том, как вы используете Stanford CoreNLP? Похоже, вы загружаете тег POS для каждого документа, что вам не нужно делать. Таким образом, вы можете загрузить теггер POS один раз (для каждого работника, если у вас есть кластер), а затем просмотреть документы, повторно используя уже загруженный тегировщик. Это также ускорит вашу обработку!

person StanfordNLPHelp    schedule 12.09.2015