Я использую en_core_web_lg для сравнения некоторых текстов на предмет сходства и не получаю ожидаемых результатов.
Проблема, я думаю, в том, что мои тексты в основном религиозны, например: Так было постановлено Тем, Кто есть Источник Божественного вдохновения. Он, воистину, Истолкователь, Мудрый. Кто претендует на откровение непосредственно от Бога до истечения полной тысячи лет, такой человек, несомненно, является лживым самозванцем.
Мой вопрос в том, есть ли способ проверить словарь spacy? Включает ли оно такие слова, как «кто возлагает декрет» или «истинно»?