Вопросы по теме 'mfcc'

MFCC в распознавании речи
Всю прошлую неделю я потратил на поиск по MFCC и связанным с ним вопросам. Теперь я могу получить функции MFCC из файла .wav в двумерном векторе, скажем, coff[56][12]. 12 — это количество коэффициентов, которые я хочу извлечь, а 56 — это количество...
3143 просмотров

Векторное квантование MFCC для проверки динамиков Скрытые марковские модели
В настоящее время я делаю проект по проверке динамиков с использованием скрытых марковских моделей. Я выбрал MFCC для извлечения признаков. Я также намерен применить к нему VQ. Я внедрил HMM и протестировал его на электронной таблице данных...
1206 просмотров
schedule 08.06.2023

как извлечь функции из коэффициентов mfcc
Я успешно извлек коэффициенты MFCC и получил значения ниже -15.2366 6.4996 -2.1807 0.2495 -1.3403 0.9815 -0.1106 1.7914 0.7311 1.1881 1.3340 2.6080 1.4208 2.0144 0.5085 -1.1236 -1.2728...
823 просмотров

Как извлечь функции MFCC в PocketSphinx на Android
Недавно я загрузил Android-демонстрацию PocketSphinx для Android Studio. Это сработало на моем Galaxy S5, и я действительно удивлен точностью. Однако я изо всех сил пытаюсь извлечь функции MFCC по нескольким причинам: Существует объяснение...
963 просмотров
schedule 01.04.2023

распознавание речи с использованием HMM или MFCC
пожалуйста, помогите мне в распознавании речи с использованием HMM (скрытые марковские модели) или MFCC (частотный кепстральный коэффициент Мела) с помощью longage С# или С++. Я хочу распознавать слова «один», «два»... до «десять»). Когда я говорю...
558 просмотров
schedule 05.03.2022

Как выполнить DTW для массива коэффициентов MFCC?
В настоящее время я работаю над проектом распознавания речи в MATLAB. Я взял два голосовых сигнала и извлек их коэффициенты MFCC. Насколько мне известно, теперь я должен вычислить евклидово расстояние между ними, а затем применить алгоритм DTW. Вот...
1250 просмотров

Источник несовместимых матриц в коде Matlab Voicebox
Я использую функцию melcepst в подпрограмме Matlab Voicebox для получения MFCC из звукового файла. Ниже приведен код, который я использую, с примером файла wav. Мои фактические файлы - это 1-секундные файлы wav, сэмплированные с частотой 48000 Гц...
101 просмотров
schedule 15.04.2022

Уменьшить выход MFCC
Я пытаюсь проанализировать звук песни, используя библиотеку python, вывод представляет собой массив numpy, массив очень большой по размеру, поскольку MFCC рассчитывается для каждого кадра звука. Когда я записываю этот вывод в файл, каждая песня имеет...
130 просмотров
schedule 06.12.2022

Извлечение функций MFCC, Librosa
Я хочу извлечь функции mfcc из аудиофайла, дискретизированного с частотой 8000 Гц, с размером кадра 20 мс и перекрытием 10 мс. Какими должны быть параметры функции librosa.feature.mfcc (). Указывает ли в приведенном ниже коде фрагменты по 20 мс с...
2408 просмотров
schedule 12.08.2023

Стандартизировать массив 3D NumPy, дополненный np.nan
У меня есть 3D-матрица формы (100, 40, 170). Эта матрица была дополнена для достижения максимальной длины 170 путем заполнения np.nan (NaN). Значения в матрице представляют собой коэффициенты MFCC из аудиоданных, извлеченных из набора данных...
184 просмотров
schedule 16.01.2024

Как получить тот же результат mfcc, что и librosa, используя aubio?
Я пытаюсь рассчитать функцию Mfcc на С++. И я нашел Aubio ( https://github.com/aubio/aubio ), но я не могу создать такой же результат как Librosa Python (это важно). Код Либрозы: X, sample_rate = sf.read(file_name, dtype='float32') mfccs =...
493 просмотров
schedule 26.08.2022

Распознавание речи с помощью CNN и Librosa: Могу ли я комбинировать MFCC и аудиоданные?
Я создаю CNN для распознавания речи с помощью Librosa. Я извлек MFCC для каждого аудиофайла и предварительно обработал свои аудиоданные. Аудиоданные имеют размеры (93894, 8000), а MFCC имеют размеры (93894, 26, 16). В таком виде я не могу...
84 просмотров
schedule 20.04.2022

Получите информацию о времени из MFCC, сгенерированную с помощью librosa.feature.mfcc.
Я извлекаю MFCC из аудиофайла с помощью функции Librosa (librosa.feature.mfcc) и правильно возвращаю массив numpy с формой, которую я ожидал: 13 значений MFCC для всей длины аудиофайла, который составляет 1292 окна (в 30 секунд). Чего не хватает,...
77 просмотров
schedule 28.05.2022

Спектрограмма MFCC против спектрограммы Сципи
В настоящее время я работаю над сверточной нейронной сетью (CNN) и начал смотреть на различные графики спектрограмм: Что касается графика Либрозы (MFCC), спектрограмма сильно отличается от других графиков спектрограммы. Я взглянул на...
240 просмотров
schedule 11.04.2022