Преобразование данных микрофона в частотный спектр

Я пытаюсь создать программу спектрограммы (на Python), которая будет анализировать и отображать частотный спектр с микрофонного входа в реальном времени. Я использую программу-шаблон для записи звука отсюда: http://people.csail.mit.edu/hubert/pyaudio/#examples (пример записи)

Эта программа-шаблон работает нормально, но я не уверен в формате данных, возвращаемых из строки data = stream.read(CHUNK). Я провел некоторое исследование формата .wav, который используется в этой программе, но я не могу найти значение самих байтов данных, а только определения метаданных в файле .wav.

Я понимаю, что эта программа использует 16-битные образцы, а «фрагменты» хранятся в строках Python. Я надеялся, что кто-нибудь поможет мне понять, что именно представляют данные в каждом образце. Даже просто ссылка на источник этой информации будет полезна. Я пробовал поискать в Google, но не думаю, что знаю терминологию достаточно хорошо для точного поиска.


person stokastic    schedule 04.08.2014    source источник
comment
stackoverflow.com/questions/3694918/   -  person cwa    schedule 05.08.2014


Ответы (1)