Извлечение фраз с помощью Spacy

Мне было интересно, есть ли у spacy какие-либо API для извлечения фраз*, как это было бы при использовании word2phrase или класса Phrases из gensim. Спасибо.

PS. Фразы также называют коллокациями в лингвистике.


person user_1177868    schedule 31.03.2021    source источник


Ответы (2)


Мне интересно, видели ли вы PyTextRank или spacycaKE для SpaCy?

Оба могут помочь с извлечением фраз, что невозможно напрямую с помощью SpaCy.

person sophros    schedule 01.04.2021

Функция фрагментов существительных в spaCy — это полезная форма извлечения фраз, хотя она сильно отличается от фразы gensim или word2phrase.

import spacy

nlp = spacy.load("en_core_web_sm")
doc = nlp("Autonomous cars shift insurance liability toward manufacturers")
for chunk in doc.noun_chunks:
    print(chunk.text, chunk.root.text, chunk.root.dep_,
            chunk.root.head.text)

Выход:

Autonomous cars cars nsubj shift
insurance liability liability dobj shift
manufacturers manufacturers pobj toward

Вы также можете использовать сопоставители на основе правил, чтобы получить другие типы фраз, определяемые частью речевых последовательностей, отношений зависимости или других спецификаций.

person polm23    schedule 03.04.2021