Как сделать языковое моделирование с помощью HTK

Я не понимаю, как использовать HTK для языкового моделирования. Я следовал учебному примеру с сайта Voxforge.

http://www.voxforge.org/home/dev/acousticmodels/linux/create/htkjulius/tutorial

После обучения и тестирования я получил около 78% точности. Я сделал это для своего родного языка. Теперь мне нужно использовать HTK для языкового моделирования.

Есть ли какой-нибудь учебник для того, чтобы сделать то же самое? Пожалуйста помогите.

Спасибо, speech_tri


htk
person speech_tri    schedule 27.10.2016    source источник


Ответы (1)


Если я правильно понимаю ваш вопрос, вы пытаетесь перейти от «грамматики» к «языковой модели n-грамм». Эти два метода являются альтернативными способами указания, какие комбинации слов допустимы в ответах, которые вернет распознаватель. Следуя процессу Voxforge, у вас, вероятно, будет готовая грамматика.

Языковая модель возникает в результате анализа корпуса текста, который определяет вероятности появления слов вместе. Используемый корпус текстов может быть очень специализированным. Существует ряд инструментов анализа, таких как SRILM (http://www.speech.sri.com/projects/srilm/) и MITLM (https://github.com/mitlm/mitlm), который будет читать корпус и создавать модель.

Поскольку вы используете слова из своего родного языка, вам понадобится уникальный корпус текста для анализа. Одним из способов получить тестовый корпус было бы искусственно сгенерировать несколько предложений из существующей грамматики и использовать их в качестве корпуса. Затем с новой языковой моделью вы просто указываете распознавателю на нее, а не на грамматику, и надеетесь на лучшее.

person Colin Beckingham    schedule 21.01.2017