Публикации по теме 'voice-recognition'


Делитесь звуком своего голоса
Что вас идентифицирует? Я уверен, что в этот список входит и ваш голос. Звук вашего голоса, то, как вы говорите, то, что вы говорите, - все это помогает близким вам людям узнавать вас. Идентификация в общении Со временем появились технологии, которые позволяли людям, разделенным расстоянием, общаться друг с другом. Вначале он включал мало информации и очень длительные периоды времени для доставки, например, при обмене письмами через почтовое отделение. Тип и количество..

Преобразование речи в текст на Python с использованием IBM watson
Поэтому у меня была задача разработать веб-приложение для преобразования речи в текст с использованием как потокового, так и непотокового сервиса (подробнее о разнице я расскажу позже в этом посте). Разработка этого проекта была чем-то новым для меня, так как я никогда раньше не изучал распознавание речи, и выбор одного из множества доступных сервисов, таких как облако Google и IBM Watson, потребовал небольшого исследования. В конце концов, я выбрал IBM watson по той простой причине,..

Основные технологии облачной модели распознавания голоса Alibaba
Ян Чжицзе — старший эксперт по алгоритмам и главный научный сотрудник по взаимодействию человека и машины в Alibaba Cloud. Его области исследований включают распознавание голоса, синтез голоса, распознавание и проверку говорящего, распознавание рукописного текста OCR и алгоритм машинного обучения. Он долгое время был членом экспертной группы ведущих научных конференций и журналов в области распознавания голоса. Кроме того, он владеет несколькими патентами США и РСТ. В следующей статье..

Вопросы по теме 'voice-recognition'

Распознавание голоса: голосовое управление
Несколько дней назад я попросил идею проекта для моего проекта B.tech Final year. К сожалению, не смог получить ни одной классной идеи. Теперь у меня есть идея, которая меня очень радует и мотивирует. Я хочу спросить у умных парней, что за 5...
838 просмотров

Преобразование голоса в текст с помощью JSAPI
Если кто-нибудь знает о преобразовании «голос в текст» с использованием java, пожалуйста, дайте мне немного знаний. Спасибо!
2656 просмотров
schedule 01.02.2022

Использование SpeechRecognizer API напрямую - onResults() продолжает возвращать значение null
Я пытался следовать примеру в этом сообщении . Поскольку я не пытаюсь реализовать это в службе, а скорее в стандартной деятельности, я не сталкивался с проблемами, описанными в вышеупомянутый пост . Однако я продолжаю получать «Нет голосовых...
4057 просмотров

минимальная отсечка громкости микрофона при распознавании голоса Windows
Я использую API распознавания голоса Windows, и он постоянно обнаруживает очень низкий фоновый шум как слово «если». Я пытался найти способ установить минимальное требование к объему, чтобы он начал принимать ввод, но все его члены настроены только...
883 просмотров
schedule 08.09.2023

Насколько большим должен быть корпус для создания языковой модели Sphinx?
Я хотел бы знать, сколько документов, предложений или слов мне нужно обработать, чтобы получить хорошую языковую модель предметной области и использовать ее в инструментах распознавания голоса, таких как CMU Sphinx.
642 просмотров
schedule 17.05.2022

оценка произношения (правильность голоса)
Существуют ли алгоритмы или библиотеки для C#, которые можно использовать для оценки произношения пользователей? Например, что-то вроде расстояния Левенштейна для текста, но для речи. Любые связанные ссылки или информация об алгоритмах будут...
1847 просмотров

Библиотеки распознавания голоса Ruby
Существуют ли какие-либо библиотеки распознавания голоса, полностью построенные на Ruby или на кроссплатформенных языках, которые имеют реализации Ruby (например, Java)? Желательно то, что не требует большого количества кода для начала использования.
1323 просмотров
schedule 28.05.2022

Голосовая биометрия Java
Я хочу разработать приложение на основе биометрического распознавания голоса . В частности, я хочу разработать приложение, которое будет записывать голос с телефона и определять говорящего. Если тот же человек позвонит снова, он распознает голос....
15156 просмотров
schedule 21.02.2023

Как распознать человеческий голос по коду в iphone?
Я хочу интегрировать функцию распознавания голоса в свое приложение для iPhone. Приложение для iPhone позволяет пользователю искать слово, используя свой голос. Но я не знаю ни одной информации о распознавании голоса в iPhone. Не могли бы вы...
1899 просмотров

Могу ли я взять голосовые данные (например, в формате mp3) из системы распознавания речи?
Возможный дубликат: Android: запись голоса и сохранение звука Я имею в виду ; Я использую классы распознавания голоса на Android, и мне удается распознавать голос. Но я хочу вместо этого реальные голосовые данные, а не слова....
2390 просмотров

Как алгоритмы распознавания речи распознают омофоны?
Я обдумывал этот вопрос ранее. Какие подсказки используют современные алгоритмы (в частности, те, которые преобразуют голос в текст), чтобы определить, какой омофон был произнесен (например, «тоже» или «два»?) Используют ли они контекстуальные...
1892 просмотров

Дополнительные результаты распознавания речи в автономном режиме Android
Я пытаюсь получить массив с дополнительными результатами от механизма распознавания речи Android Google, используя эту строку: ArrayList<String> text = data.getStringArrayListExtra(RecognizerIntent.EXTRA_RESULTS); Однако это работает...
626 просмотров
schedule 03.06.2022

MFCC в распознавании речи
Всю прошлую неделю я потратил на поиск по MFCC и связанным с ним вопросам. Теперь я могу получить функции MFCC из файла .wav в двумерном векторе, скажем, coff[56][12]. 12 — это количество коэффициентов, которые я хочу извлечь, а 56 — это количество...
3143 просмотров

Ориентация на распознавание голоса Android
Я пишу приложение для игры с карточками для начинающих для обучения слову зрения (например, «и», «быть», «собака», «если», «играть» и т. д.). Я использую распознавание голоса, чтобы отобразить слово, которое нужно прочитать, а затем распознать, что...
41 просмотров
schedule 09.12.2022

Подбор голоса в Android
Есть ли способ сделать голосовое сопоставление в Android? Возьмем приведенный ниже сценарий. Пользователь «А» говорит что-то в приложении и записывает это на телефон через приложение. Пользователь «Б» говорит что-то в приложении и записывает...
4653 просмотров

Можно ли программно запускать голосовую диктовку в поле формы ввода текста в мобильном Safari iOS с помощью JavaScript?
Мне нужно, чтобы функция голосового ввода на клавиатуре iOS запускалась программно через JavaScript, щелкнув значок микрофона. Не только путем обнаружения события «вставки»: я имею в виду запрос пользователя на голосовую диктовку. Я знаю, что iOS...
3170 просмотров

Откройте контекстное меню с помощью голосовых команд в Google Glass.
Я работаю над приложением, в котором приложение откроется, когда я просто даю голосовую команду, например "Хорошо,стекло"->Демонстрационное приложение . и это работает нормально. Теперь я хочу, когда приложение открыто, я хочу отобразить...
479 просмотров

Можно ли остановить запись вручную с помощью Voice RecognizerIntent в Android?
Сейчас я работаю с распознавателем голоса в Android, используя RecognizerIntent . Вот моя двусмысленность, После нажатия кнопки записи из-за использования RecognizerIntent отображается одно всплывающее окно с диктофоном. После того, как он что-то...
494 просмотров
schedule 09.10.2022

Распознавание речи Android ограничено набором строк
Я пытаюсь реализовать распознавание голоса в Android. Я следил за различными учебными пособиями, в которых говорится, что нам нужно позвонить RecognizerIntent с RecognizerIntent.ACTION_RECOGNIZE_SPEECH и начать действие для получения результата....
658 просмотров

Вернуться к моей MainActivity из сторонней активности с помощью VoiceRecognition
у меня есть приложение, которое запускается голосовыми командами: Activity1 (другое действие моего приложения) Activity2 (другое действие моего приложения) Любая активность, установленная на устройстве я также могу вернуться из Activity1...
250 просмотров