Вопросы по теме 'pos-tagger'
Маллет CRF SimpleTagger фразы / несколько слов
Я новичок в Mallet, я пытаюсь использовать mallet Simple tagger/CRF и экспериментирую с фразами - я пробовал искать документацию на сайте mallet, а также просматривал пользовательские архивы - ничего не помогло.
Я пробовал тренировать молоток для...
869 просмотров
schedule
19.08.2022
С# с запуском внешнего пакета и java-файла
Я использую приложение Stanford POS-tagger для маркировки некоторых статей примерно в 300 файлах. Для этого я написал код C#, который будет просматривать файлы и использовать тегировщик.
Мой код выглядит так:
Process thisProcess=new Process();...
856 просмотров
schedule
16.09.2023
удалить множественное число при использовании тега Stanford pos
Я пытаюсь заменить множественное число на единственное (например, от девочек к девушке), используя Стэнфордский теггер.
private static final String vbnTag = "VBN";
private static final String vbdTag = "VBD";
private static final String jjTag =...
232 просмотров
schedule
26.02.2024
Маркировка POS в Scala
Я попытался пометить POS-тегом предложение в Scala, используя синтаксический анализатор Stanford, как показано ниже.
val lp:LexicalizedParser = LexicalizedParser.loadModel("edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz");...
2729 просмотров
schedule
03.10.2023
Почему в наборе тегов POS Penn Treebank есть отдельный тег для слова «кому»?
В наборе тегов Penn Treebank есть отдельный тег TO для слова ' to', независимо от того, используется ли оно в смысле предлога (например, I went to school ) или в смысле инфинитива (например, I want to eat ). Какой цели это служит с общей точки...
514 просмотров
schedule
04.06.2023
обучение тегу частей речи в opennlp
Я пытаюсь обучить POS-тегер opennlp, который будет помечать слова в предложении в соответствии с моим конкретным словарным запасом. Например:
После обычной POS-маркировки:
предложение: NodeManager/NNP failed/VBD to/TO start/VB the/DT server/NN...
1662 просмотров
schedule
21.01.2023
Фильтрация определенной части речи NLTK
это должно быть просто, но я как-то упускаю это. У меня есть код:
import nltk
f=open('...\\t.txt','rU')
raw=f.read()
tokens = nltk.word_tokenize(raw)
print nltk.pos_tag(tokens)
который возвращает, например:
"[('процессы', 'NNS'), ('a',...
3553 просмотров
schedule
16.12.2022
Конфликт между Stanford Parser и Stanford POS tagger
Я работаю над проектом, который требует от меня добавления тегов POS во входную строку. Я также собираюсь использовать структуру грамматических зависимостей , сгенерированную анализатором Стэнфорда, для последующей обработки.
На что следует...
811 просмотров
schedule
07.03.2024
Заменить слова в специальную строку, кроме существительных и прилагательных в Python
Я хочу заменить слова (например, глаголы, наречия ...) некоторой специальной строкой (например, "NIL"), кроме прилагательных и существительных.
То есть для текста:
анархизм возник как термин оскорбления, впервые использованный против ранних...
766 просмотров
schedule
25.01.2023
Как я могу удалить POS-теги перед косой чертой в nltk?
Это часть моего проекта, где мне нужно представить вывод после обнаружения фразы следующим образом: (a,x,b), где a, x, b — фразы. Я построил код и получил вывод следующим образом:
(CLAUSE (NP Jack/NNP) (VP loved/VBD) (NP Peter/NNP))
(CLAUSE (NP...
2025 просмотров
schedule
27.10.2023
Как создать корпус с POS-тегами с помощью NLTK?
Я пытаюсь создать корпус с POS-тегами из внешних файлов .txt для фрагментации и извлечения сущностей и отношений. До сих пор я нашел громоздкое многошаговое решение:
Чтение файлов с помощью простого текстового корпуса:
from...
1416 просмотров
schedule
29.07.2023
Не удалось создать экземпляр StanfordNERTagger в OS X
Я пытаюсь создать экземпляр StanfordNERTagger . Вот что я пытаюсь:
st = StanfordNERTagger("/Users/attitude/Desktop/english.all.3class.caseless.distsim.crf.ser.gz","/Users/attitude/Desktop/stanford-ner-2015-12-09/stanford-ner.jar")
Я...
372 просмотров
schedule
12.03.2023
Train Gate POS tagger для другого языка
Я хочу переобучить pos-tagger GATE для моего родного языка. Есть ли поезд в GATE? Как должны быть отформатированы обучающие образцы? Заранее спасибо
120 просмотров
schedule
22.02.2022
Как убрать квадратные скобки в результате pos_tag
Я хочу извлечь существительные из фрейма данных. я делаю как показано ниже
import pandas as pd
import nltk
from nltk.tag import pos_tag
df = pd.DataFrame({'pos': ['noun', 'Alice', 'good', 'well', 'city']})
noun=[]
for index, row in...
331 просмотров
schedule
12.03.2022
Выбор текста из соответствующих тегов в последовательности в R
Я пытаюсь последовательно извлечь текст из соответствующего тега в предложении. В основном я пытаюсь получить часть речи, соответствующую каждому предложению в текстовом файле. Код:
posText<- "The VeriFone is not working, when customers...
364 просмотров
schedule
15.05.2022
NLTK Chunk Parser: как экранировать специальные символы
Итак, я пытаюсь извлечь некоторую информацию из текста и использую фрагментацию NLTK.
Вот мой вклад
The stocks show 67% rise, last year it was 12% fall
я хочу захватить
67% rise и 12% fall
POS Тегирование приведенного выше...
854 просмотров
schedule
02.05.2023
Токенизация и POS-теги в Python из файла CSV
Я новичок в Python и хотел бы использовать теги POS после импорта файла csv с моего локального компьютера. Я поискал ресурсы в Интернете и обнаружил, что следующий код работает.
text = 'Senator Elizabeth Warren from Massachusetts announced her...
995 просмотров
schedule
29.12.2022
python3 nltk, WordNetLemmatizer Произошла ошибка
Я посмотрел на книгу и сделал код, как это было в книге. Кстати, у меня следующая ошибка. Что я должен делать?
from nltk.stem import PorterStemmer, WordNetLemmatizer
sent = 'The laughs you two heard were triggered by memories
of...
1497 просмотров
schedule
23.10.2023
Python: TaggedCorpusReader, как перейти от STTS к универсальному набору тегов
Я работаю над POS Tagger, используя Python и Keras. Данные, которые у меня есть, используют теги STTS, но я должен создать Tagger для универсального набора тегов. Так что мне нужно перевести это.
Сначала я подумал сделать словарь и просто...
200 просмотров
schedule
15.05.2024
Теггер части речи Стэнфорда выдает ошибку атрибута
Я пробовал разные учебные пособия, чтобы научиться использовать стэнфордский тегировщик частей речи в Python. В настоящее время я использую следующий код для маркировки сообщений с помощью тега Stanford. Однако я получаю AttributeError . Мой код...
187 просмотров
schedule
17.12.2022