У меня есть данные csv, как показано ниже.
**token** **label**
0.45" length
1-12 size
2.6" length
8-9-78 size
6mm length
Всякий раз, когда я получаю текст, как показано ниже
6mm 8-9-78 silver head
Я должен быть в состоянии сказать length = 6mm
и size = 8-9-78
. Я новичок в мире НЛП, я пытаюсь решить эту проблему с помощью Huggingface NER. Я просмотрел различные статьи. Я не понимаю, как тренироваться с моими собственными данными. Какие model/tokeniser
следует использовать? Или я должен построить свой собственный? Любая помощь будет оценена по достоинству.