Вопросы по теме 'pos-tagger'

Маллет CRF SimpleTagger фразы / несколько слов
Я новичок в Mallet, я пытаюсь использовать mallet Simple tagger/CRF и экспериментирую с фразами - я пробовал искать документацию на сайте mallet, а также просматривал пользовательские архивы - ничего не помогло. Я пробовал тренировать молоток для...
869 просмотров
schedule 19.08.2022

С# с запуском внешнего пакета и java-файла
Я использую приложение Stanford POS-tagger для маркировки некоторых статей примерно в 300 файлах. Для этого я написал код C#, который будет просматривать файлы и использовать тегировщик. Мой код выглядит так: Process thisProcess=new Process();...
856 просмотров
schedule 16.09.2023

удалить множественное число при использовании тега Stanford pos
Я пытаюсь заменить множественное число на единственное (например, от девочек к девушке), используя Стэнфордский теггер. private static final String vbnTag = "VBN"; private static final String vbdTag = "VBD"; private static final String jjTag =...
232 просмотров
schedule 26.02.2024

Маркировка POS в Scala
Я попытался пометить POS-тегом предложение в Scala, используя синтаксический анализатор Stanford, как показано ниже. val lp:LexicalizedParser = LexicalizedParser.loadModel("edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz");...
2729 просмотров
schedule 03.10.2023

Почему в наборе тегов POS Penn Treebank есть отдельный тег для слова «кому»?
В наборе тегов Penn Treebank есть отдельный тег TO для слова ' to', независимо от того, используется ли оно в смысле предлога (например, I went to school ) или в смысле инфинитива (например, I want to eat ). Какой цели это служит с общей точки...
514 просмотров
schedule 04.06.2023

обучение тегу частей речи в opennlp
Я пытаюсь обучить POS-тегер opennlp, который будет помечать слова в предложении в соответствии с моим конкретным словарным запасом. Например: После обычной POS-маркировки: предложение: NodeManager/NNP failed/VBD to/TO start/VB the/DT server/NN...
1662 просмотров
schedule 21.01.2023

Фильтрация определенной части речи NLTK
это должно быть просто, но я как-то упускаю это. У меня есть код: import nltk f=open('...\\t.txt','rU') raw=f.read() tokens = nltk.word_tokenize(raw) print nltk.pos_tag(tokens) который возвращает, например: "[('процессы', 'NNS'), ('a',...
3553 просмотров
schedule 16.12.2022

Конфликт между Stanford Parser и Stanford POS tagger
Я работаю над проектом, который требует от меня добавления тегов POS во входную строку. Я также собираюсь использовать структуру грамматических зависимостей , сгенерированную анализатором Стэнфорда, для последующей обработки. На что следует...
811 просмотров
schedule 07.03.2024

Заменить слова в специальную строку, кроме существительных и прилагательных в Python
Я хочу заменить слова (например, глаголы, наречия ...) некоторой специальной строкой (например, "NIL"), кроме прилагательных и существительных. То есть для текста: анархизм возник как термин оскорбления, впервые использованный против ранних...
766 просмотров
schedule 25.01.2023

Как я могу удалить POS-теги перед косой чертой в nltk?
Это часть моего проекта, где мне нужно представить вывод после обнаружения фразы следующим образом: (a,x,b), где a, x, b — фразы. Я построил код и получил вывод следующим образом: (CLAUSE (NP Jack/NNP) (VP loved/VBD) (NP Peter/NNP)) (CLAUSE (NP...
2025 просмотров
schedule 27.10.2023

Как создать корпус с POS-тегами с помощью NLTK?
Я пытаюсь создать корпус с POS-тегами из внешних файлов .txt для фрагментации и извлечения сущностей и отношений. До сих пор я нашел громоздкое многошаговое решение: Чтение файлов с помощью простого текстового корпуса: from...
1416 просмотров
schedule 29.07.2023

Не удалось создать экземпляр StanfordNERTagger в OS X
Я пытаюсь создать экземпляр StanfordNERTagger . Вот что я пытаюсь: st = StanfordNERTagger("/Users/attitude/Desktop/english.all.3class.caseless.distsim.crf.ser.gz","/Users/attitude/Desktop/stanford-ner-2015-12-09/stanford-ner.jar") Я...
372 просмотров

Train Gate POS tagger для другого языка
Я хочу переобучить pos-tagger GATE для моего родного языка. Есть ли поезд в GATE? Как должны быть отформатированы обучающие образцы? Заранее спасибо
120 просмотров
schedule 22.02.2022

Как убрать квадратные скобки в результате pos_tag
Я хочу извлечь существительные из фрейма данных. я делаю как показано ниже import pandas as pd import nltk from nltk.tag import pos_tag df = pd.DataFrame({'pos': ['noun', 'Alice', 'good', 'well', 'city']}) noun=[] for index, row in...
331 просмотров
schedule 12.03.2022

Выбор текста из соответствующих тегов в последовательности в R
Я пытаюсь последовательно извлечь текст из соответствующего тега в предложении. В основном я пытаюсь получить часть речи, соответствующую каждому предложению в текстовом файле. Код: posText<- "The VeriFone is not working, when customers...
364 просмотров
schedule 15.05.2022

NLTK Chunk Parser: как экранировать специальные символы
Итак, я пытаюсь извлечь некоторую информацию из текста и использую фрагментацию NLTK. Вот мой вклад The stocks show 67% rise, last year it was 12% fall я хочу захватить 67% rise и 12% fall POS Тегирование приведенного выше...
854 просмотров
schedule 02.05.2023

Токенизация и POS-теги в Python из файла CSV
Я новичок в Python и хотел бы использовать теги POS после импорта файла csv с моего локального компьютера. Я поискал ресурсы в Интернете и обнаружил, что следующий код работает. text = 'Senator Elizabeth Warren from Massachusetts announced her...
995 просмотров
schedule 29.12.2022

python3 nltk, WordNetLemmatizer Произошла ошибка
Я посмотрел на книгу и сделал код, как это было в книге. Кстати, у меня следующая ошибка. Что я должен делать? from nltk.stem import PorterStemmer, WordNetLemmatizer sent = 'The laughs you two heard were triggered by memories of...
1497 просмотров
schedule 23.10.2023

Python: TaggedCorpusReader, как перейти от STTS к универсальному набору тегов
Я работаю над POS Tagger, используя Python и Keras. Данные, которые у меня есть, используют теги STTS, но я должен создать Tagger для универсального набора тегов. Так что мне нужно перевести это. Сначала я подумал сделать словарь и просто...
200 просмотров
schedule 15.05.2024

Теггер части речи Стэнфорда выдает ошибку атрибута
Я пробовал разные учебные пособия, чтобы научиться использовать стэнфордский тегировщик частей речи в Python. В настоящее время я использую следующий код для маркировки сообщений с помощью тега Stanford. Однако я получаю AttributeError . Мой код...
187 просмотров
schedule 17.12.2022