Я работаю над проектом, посвященным упрощению текста, есть несколько открытых источников, которые предоставляют анализатор текста, такой как Stanford parser. интересно, есть ли какой-нибудь парсер, способный анализировать текст с помощью машинного обучения!
Упрощение текста с помощью машинного обучения
Ответы (1)
OpenNLP — очень хорошая библиотека с открытым исходным кодом для этого. Вы можете обучить эту библиотеку для создания модели, соответствующей вашим потребностям, с использованием множества конкретных алгоритмов машинного обучения, таких как MaxEnt. Вы также можете просмотреть это обсуждение.
В то время как OpenNLP предоставляется с лицензией Apache, существует другой инструмент под названием LingPipe, который также предоставляет аналогичные функции, но с другой лицензией.
Mahout также является хорошей библиотекой для машинного обучения, однако для этого вам нужно извлечь функции из текста, используя какой-либо другой парсер или вашу собственную реализацию. Mahout нужны функции для обучения.
Учебники: 1. Учебники OpenNLP 2. Учебники LingPipe