CMUSphinx объединить несколько словарей в один?

Я работаю над преобразованием речи cmusphinx в текст, мне нужно обучить/добавить слова в мой словарь, поэтому я использовал lmtool и загрузил файл корпуса, использовал файлы .dict и .lm и использовал их в качестве параметров для pocketsphinx, и это сработало. Мне интересно, как добавить эти файлы в файлы по умолчанию. то есть я хочу добавить новые слова .dict и .lm файлы в /edu/cmu/sphinx/models/en-us/cmudict-en-us.dict и /edu/cmu/sphinx/models/en-us/en-us.lm.bin

Я не уверен, возможно ли это, и мне интересно, как объединить словари в один. Я нашел эту ссылку, но не знаю, как добиться того же.

Когда я использую ссылку TranscriberDemo.java в моем wav-файле другие слова, и выходные данные печатаются по-другому. как повысить точность?


person optimus    schedule 12.07.2016    source источник


Ответы (1)


Расширение словаря и языковой модели рассматривается в следующей части руководства.

http://cmusphinx.sourceforge.net/wiki/tutoriallmadvanced

person Nikolay Shmyrev    schedule 12.07.2016
comment
спасибо за ответ, я прошел по ссылке, как стартер, я не в состоянии понять такие вещи, как смешивание, обрезка, есть ли какие-либо рекомендации/шаги, приведенные в документации, объединить несколько файлов словаря в Sphinx, извините за мое невежество. - person optimus; 14.07.2016