Бот для обмена сообщениями Facebook - речь в текст

Привет :) Я создал бота для обмена сообщениями Facebook с веб-перехватчиком на моем сервере, чтобы обрабатывать сообщения.

Недавно добавил классную функцию - распознавание голоса.

но я получаю аудио-вложение Facebook как URL-адрес файла mp4, ни один из знакомых API текста Speech 2 (Google Speech, Watson и т. д.) не поддерживает mp4, поэтому я должен преобразовать его в FLAC, а затем я можно получить стенограмму.

это стоило мне примерно 6-8 секунд на 5 секунд аудио ..

Есть ли текстовый api Speech 2, который поддерживает mp4? или как альтернативный способ получить звук в формате FLAC с Facebook?

Спасибо!




Ответы (1)


Amazon Lex поддерживает до 15 секунд речевого ввода для преобразования в текст. https://aws.amazon.com/lex/faqs/

person Gözde Uzgül Turan    schedule 14.07.2017
comment
Спасибо, но Amazon Lex в настоящее время поддерживает только английский язык и еще меньше входных аудиоформатов. - person Sahar Ben-Shushan; 15.07.2017