Согласно тому, что я прочитал в Интернете, нормальный диапазон основной частоты женского голоса составляет от 165 до 255 Гц. Я использую Praat, а также библиотеку Python под названием Parselmouth, чтобы получить значения основной частоты женского голоса в аудиофайле (.wav). однако я получил некоторые значения, превышающие 255 Гц (например: 400 + Гц, 500 Гц). Нормально ли получать такие большие значения?
основная частота женского голоса
Ответы (1)
Это возможно, но маловероятно, если вы пытаетесь захватить основную частоту (F0) говорящего голоса. Кажется вероятным, что вместо этого вы улавливаете более легко резонирующий обертон (например, F1 или F2).
Мои эксперименты с Praat создают у меня впечатление, что при хороших параметрах он надежно извлекает F0.
Что вам нужно сделать, так это проверить это, сравнив кривую шага со спектрограммой. Вот пример примерки, сделанной Praat (женщина-спикер):
Вы можете видеть на изображении, что
- Наиболее заметная частота кажется F2.
- Около 200 Гц, вероятно, будет F0, поскольку ниже этого уровня есть только шум (по сравнению с до / после сегмента).
- Praat рассчитал хорошую оценку F0 для сегментов голосовой речи.
Если после визуального осмотра кажется, что вы получаете неверные результаты, вы можете попробовать настроить параметры. Длина окна сильно влияет на разрешение по частоте.
Если вы не можете зафиксировать такие низкие частоты, вам следует попробовать увеличить длину окна - интуиция подсказывает, что это дает алгоритму больше шансов найти медленно изменяющиеся периодические особенности в данных.