Публикации по теме 'audio-processing'


PyAudioCensor: автоматическая цензура аудиофайлов в автономном режиме с использованием Vosk и Python.
Здесь вы узнаете, как провести цензуру аудиофайлов в автономном режиме с помощью Python без использования каких-либо API-интерфейсов распознавания речи в облаке. Во-первых, мы должны предоставить аудиофайл для цензуры. Затем мы выполняем автономное распознавание речи на аудио с помощью API Vosk. Таким образом, мы получим список слов с соответствующими временными метками. Теперь пользователь будет вводить слова для цензуры. Соответствующие временные метки этих слов обнаруживаются из..

Что не так со спектрограммами и CNN для обработки звука?
Что не так с CNN и спектрограммами для обработки звука? В последние годы были достигнуты большие результаты в создании и обработке изображений с помощью нейронных сетей. Частично это можно объяснить высокой производительностью глубоких CNN по захвату и преобразованию высокоуровневой информации в изображениях. Ярким примером этого является процесс передачи стиля изображения с использованием CNN, предложенный L. Gatys et. al. который может отображать семантическое содержание..

Вопросы по теме 'audio-processing'

Обработка звука на C# или C++
Я хотел бы создать приложение, которое использует методы искусственного интеллекта и позволяет пользователю записывать часть песни, а затем пытается найти эту песню в базе данных файлов wav. Я хотел бы использовать некоторые уже существующие...
5300 просмотров
schedule 01.12.2022

Модулируйте цифровые данные в аудио, используя AFSK
Я хочу модулировать цифровые данные в аудио. Затем передайте его через любой аудиоканал и снова демодулируйте в пункте назначения из звука в данные. Для этого я надеюсь использовать компьютерную звуковую карту и программный модем без использования...
663 просмотров
schedule 04.06.2023

Алгоритм БПФ — как преобразовать образцы в сложные структуры?
Краткая версия моего вопроса: Как перейти от массива аудиосэмплов (как Int16) к сложным структурам, используемым общими библиотеками FFT, такими как AForge? Длинная версия моего вопроса: Я новичок в обработке звука и хочу анализировать...
2078 просмотров
schedule 08.03.2022

Извлечение AudioBuffer элемента ‹audio›
Есть ли способ извлечь AudioBuffer элемента для анализа? Я хочу по возможности избежать проблем с разными источниками, возникающих при использовании XMLHttpRequest.
140 просмотров

обработка звука в labVIEW (Возможен ли потоковый процесс ??)
Я новичок в устройствах LabVIEW и NI. Я работаю над проектом активного шумоподавления, где я буду использовать два микрофонных входа и один громкоговоритель в качестве выхода. У меня есть устройства NI myRIO 1900 и CDAQ 9178 в нашей...
1241 просмотров

Почему мой компьютер не определяет правильную частоту звука?
Я разрабатываю приложение для анализа звукового спектра в реальном времени в Linux на С++ и использую БПФ для расчета величин. Приложение получает звук с простого дешевого микрофона, подключенного к ПК. Я попытался протестировать приложение с...
70 просмотров
schedule 10.03.2022

Использование AEC(webrtc) вместо AECM(webrtc)
Я использовал aecm(webrtc) на своем встроенном устройстве на базе ARM для голосовой связи. Теперь я пытаюсь изменить aecm на aec для подавления эха двойного разговора. В aecm все просто:...
2172 просмотров
schedule 16.05.2022

Добавление молчаливого кадра в файл wav с помощью python
Первый раз пишу сюда, посмотрим как пойдет. Я пытаюсь написать скрипт на питоне, который добавлял бы секунду тишины в начало файла wav, но пока безуспешно. То, что я пытался сделать, это прочитать заголовок wav, а затем добавить \0 в начало с...
7106 просмотров
schedule 20.08.2023

OpenSL es-Управление очередью аудиобуфера
Я очень новичок в openssl es. В настоящее время я экспериментирую с функциями записи и воспроизведения OpenSL для Android. Прямо сейчас у меня есть функция записи, которая хранит данные в буферной очереди. Затем я могу воспроизвести буферную...
478 просмотров
schedule 20.08.2022

Изменить громкость звука некоторых каналов с помощью AVAudioEngine
Я работаю над приложением для Mac, которое смешивает звук с видеокарты и внешней звуковой карты. Как я могу изменить громкость на каждом канале (не на каждом источнике) независимо, используя AVAudioEngine. Допустим, у меня есть AVAudioPCMBuffer...
398 просмотров

основная частота женского голоса
Согласно тому, что я прочитал в Интернете, нормальный диапазон основной частоты женского голоса составляет от 165 до 255 Гц. Я использую Praat, а также библиотеку Python под названием Parselmouth, чтобы получить значения основной частоты женского...
326 просмотров

Обнаружение частоты ниже 40 Гц с помощью TarsosDSP java android
Я делаю мобильное приложение для Android, в котором пытаюсь определить шаг с помощью TarsosDSP . Который отлично работает, только если он больше 43 Гц. Но у меня есть требование заставить его работать с 40 Гц. Когда я воспроизвожу звук, он даже не...
274 просмотров

Сравните звуковые спектры, чтобы найти различия
У меня есть несколько аудиозаписей вращающейся машины, одна, когда машина работает нормально, а другая, когда возникает проблема. На слух мы можем услышать разницу, но когда я вычисляю спектры БПФ двух записей, спектры выглядят почти одинаково (даже...
85 просмотров
schedule 15.10.2022