Sphinx кажется единственным реальным вариантом для распознавания речи Java. Документация немногочисленна и требует высокого уровня знаний предметной области. Я использовал их пример стартовой программы, и она работает для одного файла, а не для другого, очень похожего файла. В чем разница? В чем секрет заставить его работать точнее.
Этот файл, https://www.opdsupport.com/downloads/miscellaneous/sample-audio-files/52-welcome-wav/download работает, но этот, https://www.opdsupport.com/downloads/miscellaneous/sample-audio-files/49-longwelcome-wav/download нет.
Я заметил, что нерабочий файл имел другую частоту дискретизации, поэтому я использовал программу для преобразования его в 16000, но все равно не повезло