Вопросы по теме 'ner'

Как сгруппировать теги NER, чтобы получить данные из предложения в целом?
Через библиотеку CoreNLP при вызове ner() для CoreLabel я получаю строку, указывающую его именованный тег объекта (например, PERSON или DATE ). Однако я не знаю способа сравнить токены в предложении друг с другом. Например: (текст токенов,...
979 просмотров

Поезд Spacy NER по индийским именам
Я пытаюсь настроить NER Спейси для идентификации индийских имен. Следуя этому руководству https://spacy.io/usage/training , я использую этот набор данных Согласно коду, я должен предоставить данные для обучения в следующем формате:...
4400 просмотров
schedule 03.03.2024

Просторный поезд в пакете предложений
Мне было интересно, можно ли обучать модель Ner пакетами предложений вместо одного предложения за раз - как это делается здесь: https://github.com/explosion/spacy/blob/master/examples/training/train_ner.py
144 просмотров
schedule 25.10.2023

Табличные данные с использованием spacy
Я использую Spacy и мне нужна помощь в обучении нашей модели пользовательским объектам, представленным в табличном формате в документе word / pdf. Я могу обучить его с помощью настраиваемого объекта на примере ЖИВОТНЫХ, и он работает нормально. В...
475 просмотров
schedule 30.10.2023

Runnig DeepPavlov назвал распознавание сущностей
Как я могу запустить NER от DeepPavlov? У меня есть входной файл с предложениями «sentences.txt», и мне нужно поместить результаты в «result.txt».
178 просмотров
schedule 16.07.2022

Stanford CoreNLP: Как интегрировать стандартную, но обученную в России модель NER с полностью настраиваемыми моделями для лемматизации?
В настоящее время я работаю над адаптацией алгоритма разметки кореферентных тегов для русского языка в рамках моего университетского проекта, основанного на Stanford CoreNLP. По большей части это было достаточно просто: уже существуют российские...
469 просмотров
schedule 06.07.2022

Извлечение ключевых слов из документов на основе фиксированного списка ключевых слов / фраз
У меня есть список примерно из 100 ключевых слов, и мне нужно искать их в огромном корпусе из более чем 0,1 миллиона документов. Мне не нужно точное соответствие, например, если ключевое слово - Фонд роста, я ожидаю все совпадения, такие как фонды...
876 просмотров
schedule 22.07.2022

Распознавание именованных объектов с использованием NLTK: извлечение имени, адреса и организации аудитора
Я пытаюсь использовать nltk для определения лица, организации и места из предложения. Мой вариант использования состоит в том, чтобы в основном извлечь имя аудитора, организацию и место из годового финансового отчета. С nltk в python результаты...
357 просмотров
schedule 04.01.2024

Узнавание лет без предлога с Утенком
Я пытаюсь получить год из этого предложения: "events 2015" Берет только 2015 год как число. Но если я помещу предложение в https://duckling.wit.ai/ , то 2015 год будет правильным, даже если я просто поставлю 2015. Что я могу сделать,...
20 просмотров
schedule 14.11.2022

spaCy - Самый эффективный способ сортировки сущностей по меткам
Я использую конвейер spaCy для извлечения всех сущностей из статей. Мне нужно сохранить эти объекты в переменной в зависимости от метки, которой они были помечены. На данный момент у меня есть это решение, но я думаю, что оно не самое подходящее,...
888 просмотров
schedule 01.03.2022

Обучение пользовательской модели NER
Я тренировал свою модель NER на каком-то тексте и пытался найти в нем города с настраиваемыми объектами. Пример:- ('paragraph Designated Offices Party A New York Party B Delaware paragraph pricing source calculation Market Value shall...
465 просмотров
schedule 12.12.2023

Как преобразовать данные XML NER из корпуса CRAFT в формат JSON spaCy?
Как построить модель распознавания именованных сущностей (NER) с помощью spaCy для биомедицинского NER на CRAFT corpus ? Мне сложно предварительно обработать xml файлы, указанные в этом корпусе, в любой формат, используемый spacy , любая...
633 просмотров
schedule 06.03.2023

Пользовательская модель NER SpaCy: ошибка обучения парсера зависимостей
Я пытался создать собственную модель NER, используя spacy. После построения модели для сущностей необходимо было обучить модель анализаторам зависимостей. Я пробовал следовать образцу кода, представленному на веб-сайте Spacy, приведенному ниже:...
293 просмотров
schedule 16.03.2024

Можно ли использовать NER-Label в генерации кандидатов Entity Linking в spaCy?
Я хочу использовать spaCy для связывания сущностей (EL). Я уже обучил модель распознавания именованных сущностей (NER) spaCy с настраиваемыми метками в моем корпусе, зависящем от предметной области. Однако в моем следующем примере будут...
235 просмотров

Где сохраняется обученная модель NER после обучения модели Spacy с новыми объектами
Я все еще изучаю Python и создание моделей, и я новичок в НЛП с использованием Spacy. Я использовал https://spacy.io/usage/training#ner для обучения существующей модели Spacy. - en_core_web_sm. Я обучил эту модель объектам, зависящим от моей...
217 просмотров
schedule 17.03.2022

Проблема с катастрофическим забыванием Spacy Custom Name Entity Recognition (NER)
Модель не может запомнить предыдущие метки, на которых она была обучена, я знаю, что это «катастрофическое забывание», но ни один пример или блог, похоже, не помогли бы решить эту проблему. наиболее распространенный ответ на этот блог - это...
339 просмотров
schedule 13.05.2022

Обучение классификатора Stanford NER возвращает «Убито» в терминале, в чем причина и как ее решить?
Для моей диссертации моя цель - сравнить различные модели NER. В настоящее время я хотел бы начать со Стэнфордского NER из-за его популярности. Набор данных, с которым я работаю, содержит ~ 16 тыс. размеченных документов (4 класса). Из этих 16 000...
51 просмотров

Для целочисленных значений / значений дат, аннотированных с помощью Prodigy, изучает ли модель spaCy также диапазон значений?
У меня есть сеанс вундеркинда, настроенный для аннотирования определенных числовых значений в документе для возраста (от 0 до 100). Я только аннотирую номер. Мой вопрос: предположим, что вкралось искаженное значение (возраст 1000 или 22,7), поймет...
35 просмотров
schedule 24.02.2022

Преобразование данных .CSV в формат CoNLL BIO для NER
У меня есть данные в CSV-файле, который выглядит так sent_num = [0, 1, 2] text = [['Jack', 'in', 'the', 'box'], ['Jack', 'in', 'the', 'box'], ['Jack', 'in', 'the', 'box']] tags = [['B-ORG', 'I-ORG', 'I-ORG', 'I-ORG'], ['B-ORG', 'I-ORG', 'I-ORG',...
178 просмотров
schedule 23.02.2024

Huggingface NER с пользовательскими данными
У меня есть данные csv, как показано ниже. **token** **label** 0.45" length 1-12 size 2.6" length 8-9-78 size 6mm length Всякий раз, когда я получаю текст, как показано ниже 6mm 8-9-78 silver head...
31 просмотров
schedule 27.01.2024