Мне было интересно, есть ли у spacy
какие-либо API для извлечения фраз*, как это было бы при использовании word2phrase
или класса Phrases
из gensim
. Спасибо.
PS. Фразы также называют коллокациями в лингвистике.
Мне было интересно, есть ли у spacy
какие-либо API для извлечения фраз*, как это было бы при использовании word2phrase
или класса Phrases
из gensim
. Спасибо.
PS. Фразы также называют коллокациями в лингвистике.
Мне интересно, видели ли вы PyTextRank или spacycaKE для SpaCy?
Оба могут помочь с извлечением фраз, что невозможно напрямую с помощью SpaCy.
Функция фрагментов существительных в spaCy — это полезная форма извлечения фраз, хотя она сильно отличается от фразы gensim или word2phrase.
import spacy
nlp = spacy.load("en_core_web_sm")
doc = nlp("Autonomous cars shift insurance liability toward manufacturers")
for chunk in doc.noun_chunks:
print(chunk.text, chunk.root.text, chunk.root.dep_,
chunk.root.head.text)
Выход:
Autonomous cars cars nsubj shift
insurance liability liability dobj shift
manufacturers manufacturers pobj toward
Вы также можете использовать сопоставители на основе правил, чтобы получить другие типы фраз, определяемые частью речевых последовательностей, отношений зависимости или других спецификаций.