Я хочу использовать spaCy для связывания сущностей (EL). Я уже обучил модель распознавания именованных сущностей (NER) spaCy с настраиваемыми метками в моем корпусе, зависящем от предметной области. Однако в моем следующем примере будут использоваться обычные метки объекта PERSON и LOCATION.
Устанавливая псевдонимы в базе знаний (KB), KB возвращает кандидатов на наличие распознанных объектов, например кандидатами в Париж могут быть записи Викиданных Q47899 (Пэрис Хилтон), Q7137357 (Парижские Теммены), Q5214166 (Дэн Пэрис), Q90 (Париж, столица Франции) или Q830149 (Париж, округ округа Ламар, Техас, США. ).
Мой вопрос касается метки распознанного объекта. Если NER признает Париж как ЛИЦО, это исключает Q90 (Париж, столица Франции) и Q830149 (Париж, округ Ламар, штат Техас, США) из кандидатов, оставляя 3 кандидата. В то время как если бы Париж был признан МЕСТОПОЛОЖЕНИЕМ, остались только 2 других кандидата.
Можно ли каким-то образом посоветовать модели KB или EL, из какого набора сущностей выбрать кандидатов, учитывая обнаруженную метку NER? До или после обучения модели EL?