Как улучшить производительность распознавания речи Google с помощью предварительной обработки

Когда я пробую распознавать речь Google, он показывает низкую производительность на традиционном китайском аудиофайле с фоновым шумом. Могу ли я улучшить качество распознавания речи после некоторой предварительной обработки (например, улучшения речи)? Работает ли он на сервисе Google Speech?

google-cloud-speech

Wayne Chen 22.02.2018 источник

Ответы (2)

arrow_upward
2
arrow_downward

Я бы посоветовал вам просмотреть эту страницу в документации по Google Cloud Speech с указанием лучших методы предоставления речевых данных службе, включая рекомендации по предварительной обработке.

Lefteris S 01.03.2018

arrow_upward
1
arrow_downward

Сохраняйте запись как можно ближе к исходному речевому сигналу. Без искажений, без клиппирования, без шума, без искусственной предварительной обработки, такой как подавление шума и автоматическая регулировка усиления. Я думаю, что такая предварительная обработка может повредить полезную информацию в речевых сигналах.

Я скопировал ключевые моменты из Google и вставил их, как показано ниже.

Расположите микрофон как можно ближе к говорящему, особенно при наличии фонового шума.
Избегайте обрезки звука.
Не используйте автоматическую регулировку усиления (AGC).
Вся обработка шумоподавления должна быть отключена.
Послушайте образец аудио. Он должен звучать четко, без искажений или неожиданных шумов.

calmly 06.05.2019

Как улучшить производительность распознавания речи Google с помощью предварительной обработки

Ответы (2)

Похожие вопросы