Я аннотировал корпус, используя предварительно обученную синтаксическую модель (т. е. используя Parse McParseface). У меня проблема с пониманием вывода. В выходных данных воспроизводятся две метрики. Это для POS-тегов и разбора зависимостей? Если да, то какой из них отвечает за производительность POS-тегов, а какой за производительность синтаксического анализа зависимостей?
Вот результат:
INFO:tensorflow:Total processed documents: 21710
INFO:tensorflow:num correct tokens: 454150
INFO:tensorflow:total tokens: 560993
INFO:tensorflow:Seconds elapsed in evaluation: 1184.63, eval metric: 80.95%
INFO:tensorflow:Processed 206 documents
INFO:tensorflow:Total processed documents: 21710
INFO:tensorflow:num correct tokens: 291851
INFO:tensorflow:total tokens: 504496
INFO:tensorflow:Seconds elapsed in evaluation: 1193.17, eval metric: 57.85%