Упрощение текста с помощью машинного обучения

Я работаю над проектом, посвященным упрощению текста, есть несколько открытых источников, которые предоставляют анализатор текста, такой как Stanford parser. интересно, есть ли какой-нибудь парсер, способный анализировать текст с помощью машинного обучения!


person S Gaber    schedule 08.07.2012    source источник
comment
Какое упрощение вы пытаетесь сделать? Какие меры сложности вы используете?   -  person dmh    schedule 09.07.2012
comment
Я пытаюсь сделать синтаксическое упрощение, используя «ML». мерой сложности является анализ сложности. У меня есть документы, содержащие требования пользователя, мне нужно преобразовать текст в предложения, чтобы эти предложения могли представлять карты историй, как в методологии Extreme Programming Agel.   -  person S Gaber    schedule 10.07.2012
comment
Не могли бы вы привести конкретный пример вашего вклада и желаемого результата? Анализ сложности также не кажется мне четко определенным. Определение сложности текста — нетривиальная задача; какие у вас требования к пользователям?   -  person dmh    schedule 10.07.2012
comment
Возможно, мой ответ здесь поможет решить вашу проблему.   -  person Khairul    schedule 25.07.2012
comment
@Khairul, но в этом примере не используется ML ... ты думаешь, что да !!!   -  person S Gaber    schedule 13.08.2012


Ответы (1)


OpenNLP — очень хорошая библиотека с открытым исходным кодом для этого. Вы можете обучить эту библиотеку для создания модели, соответствующей вашим потребностям, с использованием множества конкретных алгоритмов машинного обучения, таких как MaxEnt. Вы также можете просмотреть это обсуждение.

В то время как OpenNLP предоставляется с лицензией Apache, существует другой инструмент под названием LingPipe, который также предоставляет аналогичные функции, но с другой лицензией.

Mahout также является хорошей библиотекой для машинного обучения, однако для этого вам нужно извлечь функции из текста, используя какой-либо другой парсер или вашу собственную реализацию. Mahout нужны функции для обучения.

Учебники: 1. Учебники OpenNLP 2. Учебники LingPipe

person vikas    schedule 08.07.2012
comment
Танки Викас, не могли бы вы поделиться документом или учебным пособием, показывающим, как это делается с открытым исходным кодом, плз !! - person S Gaber; 08.07.2012
comment
Это очень популярные проекты, поэтому поиск туториалов не должен быть большой задачей. Тем не менее, я добавил несколько ссылок в свой ответ. Также добавлена ​​еще одна библиотека машинного обучения. Надеюсь это поможет. - person vikas; 08.07.2012
comment
OpenNLP перешел с SourceForge на Apache. См. более новую документацию: opennlp.apache.org/documentation.html. - person wcolen; 10.07.2012
comment
Может быть, этот OpenNLP работает с испанским языком? Если нет....есть ли дополнительный компонент, ориентированный на испанский язык??? Спасибо - person xavendano; 06.06.2013