Запись аудио, сохранение в буфере, а затем запись байтов на звуковую карту через PulseAudio

Я пытаюсь записать звук со следующими строками кода:

// The sample type to use
static const pa_sample_spec ss = {
.format = PA_SAMPLE_S32LE , //PA_SAMPLE_S16BE, ??? Which one to us here ??? BE...Big Endian
.rate = 44100, // That are samples per second
.channels = 2
};

// Create the recording stream
// see: http://freedesktop.org/software/pulseaudio/doxygen/parec-simple_8c-example.html
if (!(s = pa_simple_new(NULL, "Record", PA_STREAM_RECORD, NULL, "record", &ss, NULL, NULL, &error))) {
    fprintf(stderr, __FILE__": pa_simple_new() failed: %s\n", pa_strerror(error));
    pa_simple_free(s);
    exit(EXIT_FAILURE);
}

int i = -1;

while (!exit_program) {
    i = (i+1) % BUFNUMBER;

    pthread_mutex_lock(&(buffer[i].write));
    // Record data and save it to the buffer
    if (pa_simple_read(s, buffer[i].buf, sizeof(buffer[i].buf), &error) < 0) {
        fprintf(stderr, __FILE__": pa_simple_read() failed: %s\n", pa_strerror(error));
        pa_simple_free(s);
        exit(EXIT_FAILURE);
    }

    // unlock the reading mutex
    pthread_mutex_unlock(&(buffer[i].read)); // open up for reading

}

Как видите, я храню прочитанные байты в структуре, называемой буфером, которая выглядит так:

#define BUFSIZE 44100  // Size of one element
#define BUFNUMBER 16 // Number of elements
#define AUDIO_BUFFER_FORMAT char

// one element of the ringbuffer
typedef struct ringbuf {
    AUDIO_BUFFER_FORMAT buf[BUFSIZE]; /* The buffer array */
    pthread_mutex_t read; /* indicates if block was read */
    pthread_mutex_t write; /* for locking writing */
} ringbuffer_element;

Другой поток пытается прочитать и воспроизвести байты, хранящиеся в буфере:

// The sample type to use
static const pa_sample_spec ss = {
.format = PA_SAMPLE_S32LE , //PA_SAMPLE_S16BE,
.rate = 44100,
.channels = 2
};

if (stream == NULL) {
    if (!(stream = pa_simple_new(NULL, "Stream", PA_STREAM_PLAYBACK, NULL, "playback", &ss, NULL, NULL, &error))) {
        fprintf(stderr, __FILE__": pa_simple_new() failed: %s\n", pa_strerror(error));
        return false;
    }
}

if (pa_simple_write(stream, buf, (size_t) size, &error) < 0) {
    fprintf(stderr, __FILE__": pa_simple_write() failed: %s\n", pa_strerror(error));
    pa_simple_free(stream);
    return false;
}


/* Make sure that every single sample was played */
if (pa_simple_drain(stream, &error) < 0) {
    fprintf(stderr, __FILE__": pa_simple_drain() failed: %s\n", pa_strerror(error));
    pa_simple_free(stream);
    return false;
}

Тем не менее, я протестировал реализацию буфера, которая отлично работает. Тем не менее, единственное, что я слышу, это шум. Поэтому мне интересно, нужно ли мне преобразовать байты, прежде чем я смогу их снова воспроизвести, чтобы это звучало как запись.

Кроме того, я не смог найти каких-либо спецификаций для моей звуковой карты и т. д. Нужно ли мне преобразовывать байты или я могу просто воспроизводить их в том виде, в каком они были записаны? Используемый мной формат что-то сломал?

Я действительно застрял здесь. Надеюсь, вы, ребята, можете помочь мне с этим.

редактировать: еще один вопрос: лучше ли использовать API ALSA, чтобы приблизиться к оборудованию для моей цели? Да, я совершенно новичок в звуковом программировании.


person Schnecki    schedule 14.09.2012    source источник
comment
Как вы гарантируете, что поток воспроизведения читает из буферного блока, в который только что был записан поток записи?   -  person Bryan    schedule 15.09.2012
comment
Разумеется, я также использую функции pthread_mutex_lock и unlock, чтобы убедиться, что буфер был записан до того, как он будет прочитан: pthread_mutex_lock(&(buffer[i].read)); // открыть для чтения // ... Воспроизвести данные через аудиовыход с помощью вызова функции следующим образом: play_data(buffer[i].buf, size); // в данном случае size == BUFSIZE pthread_mutex_unlock(&(buffer[i].write)); (извините, но я вообще не могу отформатировать свой ответ)   -  person Schnecki    schedule 15.09.2012
comment
Ok; вы также требуете блокировки чтения раньше времени? Вы взяли часть этого кода из примеров PulseAudio; Вы заставили их работать, как написано?   -  person Bryan    schedule 15.09.2012
comment
Да, замки должны быть в порядке. Если я скомпилирую два файла и направлю вывод процесса записи в процесс воспроизведения звука, я прекрасно слышу себя... Так что да, эти два файла работают отлично.   -  person Schnecki    schedule 15.09.2012
comment
Что ж, если это работает с байтами, входящими в файл и выходящими без изменений, то это отвечает на ваш вопрос «Должен ли я конвертировать байты» - нет.   -  person Bryan    schedule 15.09.2012
comment
Да, это правда... Так что я должен проверить код еще раз, я думаю.   -  person Schnecki    schedule 15.09.2012
comment
спасибо Брайан я нашел решение!   -  person Schnecki    schedule 15.09.2012


Ответы (1)


Решение:

Два значения: #define BUFSIZE 44100 // Размер одного элемента #define BUFNUMBER 16 // Количество элементов

не имеет значения. Только они не должны быть слишком маленькими. В противном случае программа зависнет при воспроизведении звука.

Важно НЕ!!! для вызова следующего фрагмента кода каждый раз, когда воспроизводится фрагмент структуры буфера. Звуковая карта имеет встроенный буфер, и по умолчанию буфер сначала заполняется, а затем воспроизводится. Вот почему при воспроизведении звука есть небольшая задержка.

/* Make sure that every single sample was played */
if (pa_simple_drain(stream, &error) < 0) {
    fprintf(stderr, __FILE__": pa_simple_drain() failed: %s\n", pa_strerror(error));
    pa_simple_free(stream);
    return false;
}

Величину задержки можно узнать по следующему коду:

pa_usec_t latency;

if ((latency = pa_simple_get_latency(stream, &error)) == (pa_usec_t) -1) {
    fprintf(stderr, __FILE__": pa_simple_get_latency() failed: %s\n", pa_strerror(error));
}

fprintf(stderr, "%0.0f usec  \r", (float)latency);

Однако задержка не постоянна и постоянно меняется. Кстати: при необходимости размер буфера можно задать при создании потока воспроизведения.

О, и я использовал: PA_SAMPLE_S16LE, однако вам просто нужно использовать одно и то же значение для записи и воспроизведения, иначе это звучит странно.

Надеюсь, это поможет кому-то.

person Schnecki    schedule 15.09.2012