Вопросы по теме 'ner'
Как сгруппировать теги NER, чтобы получить данные из предложения в целом?
Через библиотеку CoreNLP при вызове ner() для CoreLabel я получаю строку, указывающую его именованный тег объекта (например, PERSON или DATE ).
Однако я не знаю способа сравнить токены в предложении друг с другом. Например: (текст токенов,...
979 просмотров
schedule
18.02.2023
Поезд Spacy NER по индийским именам
Я пытаюсь настроить NER Спейси для идентификации индийских имен. Следуя этому руководству https://spacy.io/usage/training , я использую этот набор данных
Согласно коду, я должен предоставить данные для обучения в следующем формате:...
4400 просмотров
schedule
03.03.2024
Просторный поезд в пакете предложений
Мне было интересно, можно ли обучать модель Ner пакетами предложений вместо одного предложения за раз - как это делается здесь: https://github.com/explosion/spacy/blob/master/examples/training/train_ner.py
144 просмотров
schedule
25.10.2023
Табличные данные с использованием spacy
Я использую Spacy и мне нужна помощь в обучении нашей модели пользовательским объектам, представленным в табличном формате в документе word / pdf.
Я могу обучить его с помощью настраиваемого объекта на примере ЖИВОТНЫХ, и он работает нормально. В...
475 просмотров
schedule
30.10.2023
Runnig DeepPavlov назвал распознавание сущностей
Как я могу запустить NER от DeepPavlov?
У меня есть входной файл с предложениями «sentences.txt», и мне нужно поместить результаты в «result.txt».
178 просмотров
schedule
16.07.2022
Stanford CoreNLP: Как интегрировать стандартную, но обученную в России модель NER с полностью настраиваемыми моделями для лемматизации?
В настоящее время я работаю над адаптацией алгоритма разметки кореферентных тегов для русского языка в рамках моего университетского проекта, основанного на Stanford CoreNLP. По большей части это было достаточно просто: уже существуют российские...
469 просмотров
schedule
06.07.2022
Извлечение ключевых слов из документов на основе фиксированного списка ключевых слов / фраз
У меня есть список примерно из 100 ключевых слов, и мне нужно искать их в огромном корпусе из более чем 0,1 миллиона документов.
Мне не нужно точное соответствие, например, если ключевое слово - Фонд роста, я ожидаю все совпадения, такие как фонды...
876 просмотров
schedule
22.07.2022
Распознавание именованных объектов с использованием NLTK: извлечение имени, адреса и организации аудитора
Я пытаюсь использовать nltk для определения лица, организации и места из предложения.
Мой вариант использования состоит в том, чтобы в основном извлечь имя аудитора, организацию и место из годового финансового отчета.
С nltk в python результаты...
357 просмотров
schedule
04.01.2024
Узнавание лет без предлога с Утенком
Я пытаюсь получить год из этого предложения:
"events 2015"
Берет только 2015 год как число.
Но если я помещу предложение в https://duckling.wit.ai/ , то 2015 год будет правильным, даже если я просто поставлю 2015.
Что я могу сделать,...
20 просмотров
schedule
14.11.2022
spaCy - Самый эффективный способ сортировки сущностей по меткам
Я использую конвейер spaCy для извлечения всех сущностей из статей. Мне нужно сохранить эти объекты в переменной в зависимости от метки, которой они были помечены. На данный момент у меня есть это решение, но я думаю, что оно не самое подходящее,...
888 просмотров
schedule
01.03.2022
Обучение пользовательской модели NER
Я тренировал свою модель NER на каком-то тексте и пытался найти в нем города с настраиваемыми объектами.
Пример:-
('paragraph Designated Offices Party A New York Party B Delaware paragraph pricing source calculation Market Value shall...
465 просмотров
schedule
12.12.2023
Как преобразовать данные XML NER из корпуса CRAFT в формат JSON spaCy?
Как построить модель распознавания именованных сущностей (NER) с помощью spaCy для биомедицинского NER на CRAFT corpus ?
Мне сложно предварительно обработать xml файлы, указанные в этом корпусе, в любой формат, используемый spacy , любая...
633 просмотров
schedule
06.03.2023
Пользовательская модель NER SpaCy: ошибка обучения парсера зависимостей
Я пытался создать собственную модель NER, используя spacy. После построения модели для сущностей необходимо было обучить модель анализаторам зависимостей. Я пробовал следовать образцу кода, представленному на веб-сайте Spacy, приведенному ниже:...
293 просмотров
schedule
16.03.2024
Можно ли использовать NER-Label в генерации кандидатов Entity Linking в spaCy?
Я хочу использовать spaCy для связывания сущностей (EL). Я уже обучил модель распознавания именованных сущностей (NER) spaCy с настраиваемыми метками в моем корпусе, зависящем от предметной области. Однако в моем следующем примере будут...
235 просмотров
schedule
11.12.2023
Где сохраняется обученная модель NER после обучения модели Spacy с новыми объектами
Я все еще изучаю Python и создание моделей, и я новичок в НЛП с использованием Spacy. Я использовал https://spacy.io/usage/training#ner для обучения существующей модели Spacy. - en_core_web_sm.
Я обучил эту модель объектам, зависящим от моей...
217 просмотров
schedule
17.03.2022
Проблема с катастрофическим забыванием Spacy Custom Name Entity Recognition (NER)
Модель не может запомнить предыдущие метки, на которых она была обучена, я знаю, что это «катастрофическое забывание», но ни один пример или блог, похоже, не помогли бы решить эту проблему. наиболее распространенный ответ на этот блог - это...
339 просмотров
schedule
13.05.2022
Обучение классификатора Stanford NER возвращает «Убито» в терминале, в чем причина и как ее решить?
Для моей диссертации моя цель - сравнить различные модели NER. В настоящее время я хотел бы начать со Стэнфордского NER из-за его популярности. Набор данных, с которым я работаю, содержит ~ 16 тыс. размеченных документов (4 класса). Из этих 16 000...
51 просмотров
schedule
08.11.2023
Для целочисленных значений / значений дат, аннотированных с помощью Prodigy, изучает ли модель spaCy также диапазон значений?
У меня есть сеанс вундеркинда, настроенный для аннотирования определенных числовых значений в документе для возраста (от 0 до 100). Я только аннотирую номер. Мой вопрос: предположим, что вкралось искаженное значение (возраст 1000 или 22,7), поймет...
35 просмотров
schedule
24.02.2022
Преобразование данных .CSV в формат CoNLL BIO для NER
У меня есть данные в CSV-файле, который выглядит так
sent_num = [0, 1, 2]
text = [['Jack', 'in', 'the', 'box'], ['Jack', 'in', 'the', 'box'], ['Jack', 'in', 'the', 'box']]
tags = [['B-ORG', 'I-ORG', 'I-ORG', 'I-ORG'], ['B-ORG', 'I-ORG', 'I-ORG',...
178 просмотров
schedule
23.02.2024
Huggingface NER с пользовательскими данными
У меня есть данные csv, как показано ниже.
**token** **label**
0.45" length
1-12 size
2.6" length
8-9-78 size
6mm length
Всякий раз, когда я получаю текст, как показано ниже
6mm 8-9-78 silver head...
31 просмотров
schedule
27.01.2024