Использует ли Google Speech API функции извлечения кепстрального коэффициента частоты Mel (MFCC)?

Приветствую экспертов StackOverflow,

Я хотел бы уточнить, использует ли Google Speech API извлечение функций Mel Frequency Cepstral Coefficient (MFCC)?

Если да, то есть ли какие-либо статьи/журналы, в которых говорится об этом?

Пожалуйста, просветите меня.

Спасибо и хорошего дня.


person Perry Selva    schedule 21.12.2017    source источник


Ответы (1)


Большинство современных систем используют банк фильтров log-mel, а не MFCC. Google также добавляет вычитание шума.

Вы можете проверить эту статью по технологии Google:

Акустическое моделирование для Google Home

person Nikolay Shmyrev    schedule 22.12.2017