Использование речевого API Google, выдача с форматом аудиофайла

Надеюсь, у тебя все хорошо,

Я пытаюсь использовать API речи Google для преобразования интервью, которое я даю, непосредственно в текстовые файлы.

Я пытаюсь настроить и запустить среду, поэтому я тестирую ее с помощью файла: я действительно новичок в аудио, поэтому я преобразовал тестовый файл в FLAC с помощью онлайн-конвертера: http://www.online-convert.com/ Затем я использовал ffprobe, чтобы проверить, мне кажется, это хорошо,

Input #0, flac, from '../../Walk_Away.flac':
Metadata:
    MAJOR_BRAND     : mp42
    MINOR_VERSION   : 0
    COMPATIBLE_BRANDS: isommp42
    ARTIST          : Aaron Michael Cox
    TITLE           : Walk Away
    ENCODER         : Lavf57.57.100
  Duration: 00:03:12.08, start: 0.000000, bitrate: 185 kb/s
    Stream #0:0: Audio: flac, 16000 Hz, mono, s16
[FORMAT]
filename=../../Walk_Away.flac
nb_streams=1
nb_programs=0
format_name=flac
format_long_name=raw FLAC
start_time=0.000000
duration=192.078375
size=4444256
bit_rate=185101
probe_score=50
TAG:MAJOR_BRAND=mp42
TAG:MINOR_VERSION=0
TAG:COMPATIBLE_BRANDS=isommp42
TAG:ARTIST=Aaron Michael Cox
TAG:TITLE=Walk Away
TAG:ENCODER=Lavf57.57.100
[/FORMAT]

но, когда я пытаюсь:

node recognize.js async-gcs gs://file.flac -e LINEAR16 -r 16000

Я получаю действительно печальный результат: «Транскрипция: ,,»

Кто-нибудь может мне помочь ? Большое спасибо Иван


person ilellouch    schedule 10.03.2017    source источник


Ответы (1)


Проблема в том, что это файл FLAC, но в команде вы указали, что это необработанный аудиофайл (LINEAR16). Попробуйте еще раз, но укажите, что это файл FLAC с параметром -e FLAC, и посмотрите, поможет ли это. Таким образом, команда должна выглядеть примерно так:

node recognize.js async-gcs gs://file.flac -e FLAC -r 16000

В качестве альтернативы вы можете преобразовать аудиофайл в необработанный аудиофайл.

person blambert    schedule 10.03.2017