Идентификационный профиль API распознавания говорящего - Создать регистрацию: как записать звук в указанном формате с веб-страницы?

Формат аудиофайла должен соответствовать следующим требованиям.

  • Контейнер WAV
  • Кодирование PCM
  • Оценить 16K
  • Формат образца 16 бит
  • Каналы Моно.

Как добиться этого с веб-страницы? Не могу найти никаких ресурсов :(


person MachineGun007    schedule 11.12.2019    source источник


Ответы (1)


Используйте ffmpeg (см. вики FFmpeg или страницу руководства с man ffmpeg)

Эта команда изменит любой звук или видео на

  • PCM 16 бит (-acodec pcm_s16le)
  • 16K (-ar 16000)
  • Моно (-ac 1)

ffmpeg -i input.any -acodec pcm_s16le -ac 1 -ar 16000 output.wav

Для Интернета есть несколько вариантов: 2

  1. github.com/muaz-khan/RecordRTC
  2. https://github.com/rposbo/speaker-recognition-api/blob/master/recorder.js
person yshahin    schedule 13.12.2019
comment
как я могу сделать это с веб-страницы? - person MachineGun007; 14.12.2019
comment
Кажется, это работает github.com/rposbo/speaker-recognition- api / blob / master / - person yshahin; 16.12.2019