Я пытаюсь создать программу спектрограммы (на Python), которая будет анализировать и отображать частотный спектр с микрофонного входа в реальном времени. Я использую программу-шаблон для записи звука отсюда: http://people.csail.mit.edu/hubert/pyaudio/#examples (пример записи)
Эта программа-шаблон работает нормально, но я не уверен в формате данных, возвращаемых из строки data = stream.read(CHUNK)
. Я провел некоторое исследование формата .wav, который используется в этой программе, но я не могу найти значение самих байтов данных, а только определения метаданных в файле .wav.
Я понимаю, что эта программа использует 16-битные образцы, а «фрагменты» хранятся в строках Python. Я надеялся, что кто-нибудь поможет мне понять, что именно представляют данные в каждом образце. Даже просто ссылка на источник этой информации будет полезна. Я пробовал поискать в Google, но не думаю, что знаю терминологию достаточно хорошо для точного поиска.