Вопросы по теме 'mfcc'
MFCC в распознавании речи
Всю прошлую неделю я потратил на поиск по MFCC и связанным с ним вопросам. Теперь я могу получить функции MFCC из файла .wav в двумерном векторе, скажем, coff[56][12]. 12 — это количество коэффициентов, которые я хочу извлечь, а 56 — это количество...
3143 просмотров
schedule
29.08.2023
Векторное квантование MFCC для проверки динамиков Скрытые марковские модели
В настоящее время я делаю проект по проверке динамиков с использованием скрытых марковских моделей. Я выбрал MFCC для извлечения признаков. Я также намерен применить к нему VQ. Я внедрил HMM и протестировал его на электронной таблице данных...
1206 просмотров
schedule
08.06.2023
как извлечь функции из коэффициентов mfcc
Я успешно извлек коэффициенты MFCC и получил значения ниже
-15.2366
6.4996
-2.1807
0.2495
-1.3403
0.9815
-0.1106
1.7914
0.7311
1.1881
1.3340
2.6080
1.4208
2.0144
0.5085
-1.1236
-1.2728...
823 просмотров
schedule
07.07.2022
Как извлечь функции MFCC в PocketSphinx на Android
Недавно я загрузил Android-демонстрацию PocketSphinx для Android Studio. Это сработало на моем Galaxy S5, и я действительно удивлен точностью. Однако я изо всех сил пытаюсь извлечь функции MFCC по нескольким причинам:
Существует объяснение...
963 просмотров
schedule
01.04.2023
распознавание речи с использованием HMM или MFCC
пожалуйста, помогите мне в распознавании речи с использованием HMM (скрытые марковские модели) или MFCC (частотный кепстральный коэффициент Мела) с помощью longage С# или С++. Я хочу распознавать слова «один», «два»... до «десять»). Когда я говорю...
558 просмотров
schedule
05.03.2022
Как выполнить DTW для массива коэффициентов MFCC?
В настоящее время я работаю над проектом распознавания речи в MATLAB. Я взял два голосовых сигнала и извлек их коэффициенты MFCC. Насколько мне известно, теперь я должен вычислить евклидово расстояние между ними, а затем применить алгоритм DTW. Вот...
1250 просмотров
schedule
07.03.2022
Источник несовместимых матриц в коде Matlab Voicebox
Я использую функцию melcepst в подпрограмме Matlab Voicebox для получения MFCC из звукового файла. Ниже приведен код, который я использую, с примером файла wav. Мои фактические файлы - это 1-секундные файлы wav, сэмплированные с частотой 48000 Гц...
101 просмотров
schedule
15.04.2022
Уменьшить выход MFCC
Я пытаюсь проанализировать звук песни, используя библиотеку python, вывод представляет собой массив numpy, массив очень большой по размеру, поскольку MFCC рассчитывается для каждого кадра звука. Когда я записываю этот вывод в файл, каждая песня имеет...
130 просмотров
schedule
06.12.2022
Извлечение функций MFCC, Librosa
Я хочу извлечь функции mfcc из аудиофайла, дискретизированного с частотой 8000 Гц, с размером кадра 20 мс и перекрытием 10 мс. Какими должны быть параметры функции librosa.feature.mfcc (). Указывает ли в приведенном ниже коде фрагменты по 20 мс с...
2408 просмотров
schedule
12.08.2023
Стандартизировать массив 3D NumPy, дополненный np.nan
У меня есть 3D-матрица формы (100, 40, 170).
Эта матрица была дополнена для достижения максимальной длины 170 путем заполнения np.nan (NaN).
Значения в матрице представляют собой коэффициенты MFCC из аудиоданных, извлеченных из набора данных...
184 просмотров
schedule
16.01.2024
Как получить тот же результат mfcc, что и librosa, используя aubio?
Я пытаюсь рассчитать функцию Mfcc на С++. И я нашел Aubio ( https://github.com/aubio/aubio ), но я не могу создать такой же результат как Librosa Python (это важно). Код Либрозы:
X, sample_rate = sf.read(file_name, dtype='float32')
mfccs =...
493 просмотров
schedule
26.08.2022
Распознавание речи с помощью CNN и Librosa: Могу ли я комбинировать MFCC и аудиоданные?
Я создаю CNN для распознавания речи с помощью Librosa. Я извлек MFCC для каждого аудиофайла и предварительно обработал свои аудиоданные. Аудиоданные имеют размеры (93894, 8000), а MFCC имеют размеры (93894, 26, 16). В таком виде я не могу...
84 просмотров
schedule
20.04.2022
Получите информацию о времени из MFCC, сгенерированную с помощью librosa.feature.mfcc.
Я извлекаю MFCC из аудиофайла с помощью функции Librosa (librosa.feature.mfcc) и правильно возвращаю массив numpy с формой, которую я ожидал: 13 значений MFCC для всей длины аудиофайла, который составляет 1292 окна (в 30 секунд).
Чего не хватает,...
77 просмотров
schedule
28.05.2022
Спектрограмма MFCC против спектрограммы Сципи
В настоящее время я работаю над сверточной нейронной сетью (CNN) и начал смотреть на различные графики спектрограмм:
Что касается графика Либрозы (MFCC), спектрограмма сильно отличается от других графиков спектрограммы. Я взглянул на...
240 просмотров
schedule
11.04.2022