Преобразование данных микрофона в частотный спектр

Я пытаюсь создать программу спектрограммы (на Python), которая будет анализировать и отображать частотный спектр с микрофонного входа в реальном времени. Я использую программу-шаблон для записи звука отсюда: http://people.csail.mit.edu/hubert/pyaudio/#examples (пример записи)

Эта программа-шаблон работает нормально, но я не уверен в формате данных, возвращаемых из строки data = stream.read(CHUNK). Я провел некоторое исследование формата .wav, который используется в этой программе, но я не могу найти значение самих байтов данных, а только определения метаданных в файле .wav.

Я понимаю, что эта программа использует 16-битные образцы, а «фрагменты» хранятся в строках Python. Я надеялся, что кто-нибудь поможет мне понять, что именно представляют данные в каждом образце. Даже просто ссылка на источник этой информации будет полезна. Я пробовал поискать в Google, но не думаю, что знаю терминологию достаточно хорошо для точного поиска.

stokastic 04.08.2014 источник

comment

stackoverflow.com/questions/3694918/ - cwa 05.08.2014

Ответы (1)

arrow_upward
1
arrow_downward

stream.read дает вам двоичные данные. Чтобы получить десятичные образцы звука, вы можете использовать numpy.fromstring чтобы превратить его в массив numpy, или вы используете встроенный в Python _3 _ .

Пример:

import pyaudio
import numpy
import struct

CHUNK = 128

p = pyaudio.PyAudio()
stream = p.open(format=pyaudio.paInt16, channels=1, rate=44100, input=True, frames_per_buffer=CHUNK)

data = stream.read(CHUNK)
print numpy.fromstring(data, numpy.int16) # use external numpy module
print struct.unpack('h'*CHUNK, data) # use built-in struct module

stream.stop_stream()
stream.close()
p.terminate()

Frank Zalkow 05.08.2014

Преобразование данных микрофона в частотный спектр

Ответы (1)

Похожие вопросы