MULAW — Аудиоданные передаются слишком медленно

У меня проблема с распознаванием речи в потоковом режиме. Моим источником звука является протокол телефона VoIP (SIP), он позволяет выводить аудиоданные в формате: "encoding": "Mulaw", "sampleRateHertz": 8000

  • Когда я отправляю новую порцию данных в потоковом режиме, возникает исключение: «Статус (StatusCode = OutOfRange, Detail = «Аудиоданные передаются слишком медленно. Пожалуйста, транслируйте аудиоданные примерно в реальном времени».)»
  • Для проверки я записал данные на диск в таком формате. После того, как я прочитал данные и отправил их кусками в потоковом режиме, все работает правильно, и результат возвращается.

Получается, что ошибка появляется только в реальном времени. Прошу помощи.


person user2403256    schedule 21.08.2017    source источник


Ответы (2)


Я нашел ошибку. Я открыл сессию и через 5-10 секунд начал отправлять туда поток, из-за этого была ошибка.

person user2403256    schedule 22.08.2017

Частота дискретизации потокового аудио 8000 и RecognitionConfig.setSampleRate(8000) должны синхронизироваться одинаково,

например, если аудио передается со скоростью 8000, а RecognitionConfig.setSamplerate(16000) -> результаты Аудио передается слишком медленно

если аудио передается со скоростью 41000 и RecognitionConfig.setSamplerate(16000) -> результаты Аудио передается слишком быстро

person user3776111    schedule 26.09.2017