Я все еще изучаю Python и создание моделей, и я новичок в НЛП с использованием Spacy. Я использовал https://spacy.io/usage/training#ner для обучения существующей модели Spacy. - en_core_web_sm.
Я обучил эту модель объектам, зависящим от моей предметной области.
def main(model="en_core_web_sm", new_model_name="new_ner_model", output_dir='/content/drive/My Drive/Data/new_model', n_iter=100):
.
.
(code to train the model)
.
.
# save model to output directory
if output_dir is not None:
output_dir = Path(output_dir)
if not output_dir.exists():
output_dir.mkdir()
nlp.meta["name"] = new_model_name # rename model
nlp.to_disk(output_dir)
print("Saved model to", output_dir)
Теперь я предположил, что найду единственный файл модели в выходном каталоге. Вместо этого у меня есть 4 подпапки - voiceab, ner, tagger, parser. И 2 файла meta.json и токенизатор. В подпапке ner есть cfg, move, model.
Согласно упомянутому выше веб-сайту, для загрузки новой модели мне нужно использовать всю папку (выходной каталог), т.е.
nlp2 = spacy.load(output_dir)
Нужен ли весь каталог (это модель) или это двоичный файл с именем model во вложенной папке ner?