Публикации по теме 'named-entity-recognition'


Тот самый Гамбургер!!
ОБРАБОТКА ЕСТЕСТВЕННОГО ЯЗЫКА (ЧАСТЬ II) Далее это часть серии статей о НЛП. (Отметьте Часть I и Часть III ) Как мы видели в предыдущей статье, НЛП предоставляет интересные возможности, которые сегодня меняют многие отрасли. Круто, что компьютер может так много, но как ему это удается? О да, вы поняли, мы собираемся погрузиться в некоторые серьезные вещи! Структура НЛП Мы собираемся шаг за шагом построить структуру обработки естественного языка, и к концу этого «учебника»..

Извлечение именованных сущностей: подробное руководство с объяснением концепции, инструментов и руководств - BytesView
Извлечение именованных сущностей, также известное как распознавание сущностей, - это метод обработки естественного языка (НЛП), который идентифицирует и извлекает именованные сущности из любого заданного текста и классифицирует их по предопределенным категориям. Эти именованные объекты могут быть организациями, людьми, местоположениями, событиями, денежными значениями, количествами и даже выражениями времени. Проще говоря, он извлекает все известные сущности, физические и абстрактные...

Вопросы по теме 'named-entity-recognition'

Stanford NER — извлечение многословных сущностей
Как я могу пометить словосочетания в Stanford NER? В настоящее время он помечает Federal Reserve Bank of New York как <wi num="11" entity="ORGANIZATION">Federal</wi> <wi num="12" entity="ORGANIZATION">Reserve</wi> <wi...
1670 просмотров

Извлечение информации. Подсчет упоминаний для измерения релевантности
Можно ли посчитать, сколько раз объект упоминается в статье? Например ABC Company — один из крупнейших производителей автомобилей в мире. It также является крупнейшей компанией по годовому объему производства. It также является...
147 просмотров

независимый от языка инструмент для распознавания именованных объектов
Кто-нибудь знает, есть ли библиотеки для распознавания именованных объектов, которые не зависят от языка? Спасибо
570 просмотров
schedule 16.04.2022

Создание пользовательских функций в OpenNLP Namefinder API
Я пытаюсь использовать генерацию пользовательских функций OpenNLP для API Named Finder. http://opennlp.apache.org/documentation/1.5.3/manual/opennlp.html Я просмотрел документацию, но не смог понять, как указать различные функции. Он просто...
1832 просмотров

Извлечение многословных именованных сущностей с помощью CoreNLP
Я использую CoreNLP для извлечения именованных сущностей и столкнулся с небольшой проблемой. Проблема заключается в том, что всякий раз, когда именованная сущность состоит из более чем одного токена, например «Хан Соло», аннотатор возвращает «Хан...
3498 просмотров

Как я могу получить ссылки на обработку естественного языка (NLP) и распознавание именованных сущностей?
Я начинаю заниматься НЛП и распознаванием именованных сущностей и хочу получить ссылки на тезисы.
285 просмотров
schedule 26.04.2024

Как использовать/интегрировать Apache OpenNLP в (веб)приложение php?
Я создаю веб-приложение на php и хочу использовать инструменты обработки естественного языка. Я нашел библиотеку OpenNLP, но это все java, и у меня действительно нет опыта работы с java. Я хотел бы использовать OpenNLP в качестве веб-сервиса, где...
707 просмотров

Именованные объекты в инкапсулированном XML вызывают ошибки синтаксического анализа
У меня есть XML-документы, содержащие другие XML-документы, инкапсулированные как CDATA, например: <mds> <md> <value> <![CDATA[<?xml version="1.0" encoding="UTF-8"?><record...
121 просмотров
schedule 03.05.2022

Разделение выходных данных Stanford Named Entity Recognizer (NER) из формата NLTK
Я использую NER в NLTK, чтобы найти людей, местоположения и организации в предложениях. Я могу получить такие результаты: [(u'Remaking', u'O'), (u'The', u'O'), (u'Republican', u'ORGANIZATION'), (u'Party', u'ORGANIZATION')] Можно ли с его...
2279 просмотров

Распознавание именованных сущностей в Solr
Я пытаюсь импортировать данные в solr из mysql с помощью обработчика импорта данных. Теперь я хочу идентифицировать сущности имен из него. Я использую окно поиска ( http://www.searchbox.com/named-entity-recognition-ner-in-solr/ ). где я использую...
511 просмотров

Извлечение отношений с помощью фрагментации с использованием NLTK
Я пытаюсь понять, как использовать каскадный блокировщик NLTK в соответствии с главой 7 книги NLTK . К сожалению, я сталкиваюсь с несколькими проблемами при выполнении нетривиальных мер фрагментации. Начнем с этой фразы: "adventure movies...
2019 просмотров

OpenNLP: обучение пользовательской модели NER для нескольких объектов
Я пытаюсь обучить пользовательскую модель NER для нескольких объектов. Вот пример обучающих данных: count all <START:item_type> operating tables <END> on the <START:location_id> third <END> <START:location_type>...
2240 просмотров

Тегирование части речи и распознавание сущностей — python
Я хочу выполнить тегирование части речи и распознавание объектов в python, аналогично функциям Maxent_POS_Tag_Annotator и Maxent_Entity_Annotator openNLP в R. Я бы предпочел код в python, который принимает входные данные в виде текстового предложения...
950 просмотров

Классификация машинным обучением списков строк в JAVA без какого-либо окружающего их контекста
У меня есть несколько списков строк, уже классифицированных как <string> <tag> 088 9102355 PHONE NUMBER 091 910255 PHONE NUMBER ... Alfred St...
967 просмотров

Тренируйте Stanford NER с большой газетой, проблемы с памятью
Ранее я обучал немецкий классификатор, используя Stanford NER и обучающий файл с 450 000 токенов. Поскольку у меня было почти 20 классов, это заняло около 8 часов, и мне пришлось сократить многие функции в файле реквизита. Теперь у меня есть файл...
830 просмотров

ошибка при загрузке файла .bin NER в качестве аргумента модели для openNLP::Maxent_Entity_Annotator()
Я создал модель с помощью инструмента командной строки Apache OpenNLP для распознавания именованных объектов. Приведенный ниже код создал модель, используя файл sentences4OpenNLP.txt в качестве тренировочного набора. opennlp...
489 просмотров

Количество тегов NER
Насколько мне известно, в Stanford NER есть модели 3,4 и 7 класса (или теги). Мне нужен стандарт и Java-реализация распознавателя именованных объектов, который имеет более 7 тегов (например, 13 тегов). Я не хочу разрабатывать его самостоятельно, и...
1275 просмотров

Распознавание именованных объектов NLTK для столбца в наборе данных
Благодаря коду "alvas" отсюда, Распознавание именованных объектов с регулярным выражением: NLTK и в качестве примера: from nltk import ne_chunk, pos_tag from nltk.tokenize import word_tokenize from nltk.tree import Tree def...
1805 просмотров
schedule 01.05.2022

Классификатор семи классов не дает желаемых результатов в StanfordNLP python
Я пытаюсь использовать Стэнфордский распознаватель сущностей. Я хочу использовать классификатор 7 классов, потому что я даже хочу определить время (или дату) и другие вещи в предложении. При вводе предложения: "He was born on October 15, 1931 at...
306 просмотров

TensorFlow RNN для распознавания именованных сущностей
Я пытаюсь разработать лучшую модель для адаптации к проблеме распознавания открытых именованных сущностей (биология / химия, поэтому словаря сущностей не существует, но они должны быть идентифицированы по контексту). В настоящее время я лучше всего...
5002 просмотров