Здесь я хочу использовать sox
для преобразования файла flac в файл спектрограммы png. Когда я хочу преобразовать файл .flac
, я могу использовать следующую команду
sox output.flac -n spectrogram -r -o a.png
И если я хочу преобразовать в спектрограмму N x 129 пикселей, я могу использовать следующую команду
sox output.flac -n spectrogram -Y 200 -X 50 -m -r -o spectogram.png
Однако я не совсем понимаю, что означают параметры -Y 200
и -X 50
, т.е. есть ли способ преобразовать эти параметры в частоту дискретизации, интервал времени (в миллисекундах), а также интервал частоты, как в Matlab или Python. Было бы здорово, если бы кто-то мог подробно ответить здесь, поскольку в документации в chirlu/sox не указано четко что это значит (или я не нашел это явно).