Публикации по теме 'audio-processing'
PyAudioCensor: автоматическая цензура аудиофайлов в автономном режиме с использованием Vosk и Python.
Здесь вы узнаете, как провести цензуру аудиофайлов в автономном режиме с помощью Python без использования каких-либо API-интерфейсов распознавания речи в облаке.
Во-первых, мы должны предоставить аудиофайл для цензуры. Затем мы выполняем автономное распознавание речи на аудио с помощью API Vosk. Таким образом, мы получим список слов с соответствующими временными метками. Теперь пользователь будет вводить слова для цензуры. Соответствующие временные метки этих слов обнаруживаются из..
Что не так со спектрограммами и CNN для обработки звука?
Что не так с CNN и спектрограммами для обработки звука?
В последние годы были достигнуты большие результаты в создании и обработке изображений с помощью нейронных сетей. Частично это можно объяснить высокой производительностью глубоких CNN по захвату и преобразованию высокоуровневой информации в изображениях. Ярким примером этого является процесс передачи стиля изображения с использованием CNN, предложенный L. Gatys et. al. который может отображать семантическое содержание..
Вопросы по теме 'audio-processing'
Обработка звука на C# или C++
Я хотел бы создать приложение, которое использует методы искусственного интеллекта и позволяет пользователю записывать часть песни, а затем пытается найти эту песню в базе данных файлов wav.
Я хотел бы использовать некоторые уже существующие...
5300 просмотров
schedule
01.12.2022
Модулируйте цифровые данные в аудио, используя AFSK
Я хочу модулировать цифровые данные в аудио. Затем передайте его через любой аудиоканал и снова демодулируйте в пункте назначения из звука в данные. Для этого я надеюсь использовать компьютерную звуковую карту и программный модем без использования...
663 просмотров
schedule
04.06.2023
Алгоритм БПФ — как преобразовать образцы в сложные структуры?
Краткая версия моего вопроса:
Как перейти от массива аудиосэмплов (как Int16) к сложным структурам, используемым общими библиотеками FFT, такими как AForge?
Длинная версия моего вопроса:
Я новичок в обработке звука и хочу анализировать...
2078 просмотров
schedule
08.03.2022
Извлечение AudioBuffer элемента ‹audio›
Есть ли способ извлечь AudioBuffer элемента для анализа? Я хочу по возможности избежать проблем с разными источниками, возникающих при использовании XMLHttpRequest.
140 просмотров
schedule
17.06.2022
обработка звука в labVIEW (Возможен ли потоковый процесс ??)
Я новичок в устройствах LabVIEW и NI.
Я работаю над проектом активного шумоподавления, где я буду использовать два микрофонных входа и один громкоговоритель в качестве выхода. У меня есть устройства NI myRIO 1900 и CDAQ 9178 в нашей...
1241 просмотров
schedule
27.04.2022
Почему мой компьютер не определяет правильную частоту звука?
Я разрабатываю приложение для анализа звукового спектра в реальном времени в Linux на С++ и использую БПФ для расчета величин. Приложение получает звук с простого дешевого микрофона, подключенного к ПК.
Я попытался протестировать приложение с...
70 просмотров
schedule
10.03.2022
Использование AEC(webrtc) вместо AECM(webrtc)
Я использовал aecm(webrtc) на своем встроенном устройстве на базе ARM для голосовой связи. Теперь я пытаюсь изменить aecm на aec для подавления эха двойного разговора.
В aecm все просто:...
2172 просмотров
schedule
16.05.2022
Добавление молчаливого кадра в файл wav с помощью python
Первый раз пишу сюда, посмотрим как пойдет.
Я пытаюсь написать скрипт на питоне, который добавлял бы секунду тишины в начало файла wav, но пока безуспешно.
То, что я пытался сделать, это прочитать заголовок wav, а затем добавить \0 в начало с...
7106 просмотров
schedule
20.08.2023
OpenSL es-Управление очередью аудиобуфера
Я очень новичок в openssl es. В настоящее время я экспериментирую с функциями записи и воспроизведения OpenSL для Android. Прямо сейчас у меня есть функция записи, которая хранит данные в буферной очереди. Затем я могу воспроизвести буферную...
478 просмотров
schedule
20.08.2022
Изменить громкость звука некоторых каналов с помощью AVAudioEngine
Я работаю над приложением для Mac, которое смешивает звук с видеокарты и внешней звуковой карты.
Как я могу изменить громкость на каждом канале (не на каждом источнике) независимо, используя AVAudioEngine.
Допустим, у меня есть AVAudioPCMBuffer...
398 просмотров
schedule
09.09.2022
основная частота женского голоса
Согласно тому, что я прочитал в Интернете, нормальный диапазон основной частоты женского голоса составляет от 165 до 255 Гц. Я использую Praat, а также библиотеку Python под названием Parselmouth, чтобы получить значения основной частоты женского...
326 просмотров
schedule
24.06.2022
Обнаружение частоты ниже 40 Гц с помощью TarsosDSP java android
Я делаю мобильное приложение для Android, в котором пытаюсь определить шаг с помощью TarsosDSP . Который отлично работает, только если он больше 43 Гц. Но у меня есть требование заставить его работать с 40 Гц. Когда я воспроизвожу звук, он даже не...
274 просмотров
schedule
07.06.2024
Сравните звуковые спектры, чтобы найти различия
У меня есть несколько аудиозаписей вращающейся машины, одна, когда машина работает нормально, а другая, когда возникает проблема. На слух мы можем услышать разницу, но когда я вычисляю спектры БПФ двух записей, спектры выглядят почти одинаково (даже...
85 просмотров
schedule
15.10.2022