Привет :) Я создал бота для обмена сообщениями Facebook с веб-перехватчиком на моем сервере, чтобы обрабатывать сообщения.
Недавно добавил классную функцию - распознавание голоса.
но я получаю аудио-вложение Facebook как URL-адрес файла mp4, ни один из знакомых API текста Speech 2 (Google Speech, Watson и т. д.) не поддерживает mp4, поэтому я должен преобразовать его в FLAC, а затем я можно получить стенограмму.
это стоило мне примерно 6-8 секунд на 5 секунд аудио ..
Есть ли текстовый api Speech 2, который поддерживает mp4? или как альтернативный способ получить звук в формате FLAC с Facebook?
Спасибо!