Публикации по теме 'speech'


Трудности — Обработка естественного языка (НЛП)
Информатика и дисциплина обработки естественного языка (NLP) искусственного интеллекта изучает, как взаимодействуют компьютеры и человеческие (естественные) языки. Двумя основными подполями НЛП являются распознавание и генерация речи. Генерация голоса включает в себя автономное создание письма на естественном языке из семантического содержания, в отличие от распознавания речи, которое требует распознавания, расшифровки или создания…

Вопросы по теме 'speech'

где взять сапи?
Я хочу создать приложение с поддержкой речи, но всякий раз, когда я захожу на веб-сайт MS, чтобы загрузить SAPI, я получаю сообщение об ошибке. Я хочу знать, где я могу получить SAPI. и я также хотел бы знать, может ли приложение SAPI 5.3...
2540 просмотров
schedule 22.02.2023

Запустить Microsoft.Speech через IIS?
У меня есть приложение, которое использует Microsoft.Speech для распознавания речи в файле WAV. Он отлично работает при локальном запуске в качестве консольного приложения, но не работает при выполнении IIS. Предполагая, что на WinServer 2008 с...
1893 просмотров

Кто-нибудь знаком с API распознавания речи Microsoft?
Я пишу код распознавания речи на python и хочу, чтобы он мог включать систему распознавания речи Microsoft, но я хочу, чтобы эта система игнорировала все обычные команды интерфейса графического интерфейса. Так что, если я скажу что-то, что он...
1992 просмотров
schedule 27.05.2022

Matlab: поиск доминирующих частот в кадре аудиоданных
Я новичок в Matlab и пытаюсь написать простой алгоритм обнаружения речи на основе частоты. Конечная цель состоит в том, чтобы запустить сценарий в файле wav и вывести время начала/окончания для каждого сегмента речи. Если использовать код: fr =...
7448 просмотров

Kinect Speech не получает распознаватель
Я не знаю, у кого из вас есть опыт работы с Kinect, но я разместил это на форумах MSDN почти две недели назад и не получил никакой помощи. Я ломал голову, пытаясь заставить это работать, может быть, кто-то здесь может помочь Я пытаюсь добавить речь в...
1093 просмотров
schedule 07.05.2023

Как качество микрофона влияет на распознавание речи?
Большинство сайтов, на которых я был, ясно говорят, что для распознавания речи более высокое качество микрофонов приводит к лучшим результатам. Я искал более подробную информацию, например, как следующие вещи влияют на распознавание речи:...
333 просмотров

столкнулся с проблемой при использовании Google Speech API
У меня возникают проблемы, когда я использую свой код для взаимодействия с API речи Google. Я просмотрел ссылку по следующей ссылке. JAVA с использованием API распознавания речи Google когда я использую его файл flac, я получаю текст из API...
367 просмотров

Можно ли использовать Python для преобразования текста в речь и вывода речи, как если бы она исходила из микрофона?
Я смотрел библиотеки речи Python в этом сообщение . Я нахожусь в тихом офисе, и мне приходится разговаривать с людьми по мобильному телефону, но я бы предпочел не беспокоить окружающих, если мне не нужно. Я чувствую, что если я наберу на...
920 просмотров
schedule 02.08.2022

как установить голоса OS X TTS из Objective-C
OS X Lion поставляется с фантастическими голосами от Nuance. Я хотел бы использовать их из своего программного обеспечения, однако в настоящее время они требуют, чтобы пользователь вручную зашел в «Системные настройки», «Диктовка и речь», «Системный...
340 просмотров
schedule 06.03.2023

Распознавание речи в автономном режиме Android программным способом
Я хочу использовать распознавание речи в своем приложении. Начиная с Android jellybean, я знаю, что системы Android поддерживают автономное распознавание речи (диктовку?)! Пока я могу использовать автономное распознавание только со встроенной...
2924 просмотров
schedule 22.05.2022

Преобразование полезной нагрузки последовательности RTP (закодированной с помощью GSM\opus\speex) в файл .wav
У меня есть текстовый файл, содержащий полезную нагрузку RTP-пакетов (в шестнадцатеричном формате, закодированных с помощью GSM\opus\speex), принадлежащих разговору VoIP, кто-нибудь знает, как преобразовать этот файл в аудиофайл .wav? Я использую...
1982 просмотров
schedule 08.05.2024

Автономное распознавание речи Android для отображения только слова
Мне нужна помощь с Android-речевым текстом. Можно ли отобразить только первое обнаруженное слово? Например, когда пользователь вводит «кот играет», тогда текст, который будет отображаться только в текстовом поле, представляет собой слово «the»....
237 просмотров
schedule 06.08.2022

Как создать приложение для преобразования речи в текст с помощью Swift в iOS
Я пытаюсь написать приложение для iOS (кодирование на Swift), которое преобразует речь в текст и отображает этот текст в TextView. Я использую библиотеку OpenEars. Но пока я не нашел материалов для Swift, показывающих, как преобразовывать речь в...
6870 просмотров
schedule 18.06.2022

Программа распознавания речи JARVIS не слушает голосовой ввод
Недавно я решил взглянуть на C#, потому что нашел классный туториал на YouTube о создании на нем программы распознавания речи JARVIS. Я полностью следовал руководству и сумел заставить его работать без каких-либо ошибок. Однако он не отвечает на мой...
10135 просмотров

Голосовая аутентификация
Я застрял в большой проблеме, потому что у меня нет ни идеи, ни примера, как это сделать. Что мне нужно сделать, это сравнить два голоса, например: человек 1 сказал "привет" человек 2 сказал "привет" после этого, если человек 1 снова скажет...
150 просмотров
schedule 05.09.2022

Использование Kinect Skeleton ID для распознавания речи
Я делаю проект вокруг Kinect. По сути, у меня есть база данных аудиофайлов для нескольких пользователей. Из этих пользователей только один будет стоять перед Kinect (в пределах его досягаемости). Kinect будет отслеживать скелет, давая ему...
190 просмотров
schedule 01.12.2023

контекстное окно распознавания речи кадров
Во многих документах по распознаванию речи я вижу термин «контекстное окно кадра». Я не уверен в этом, но кажется, что вы берете кадр x из высказывания и объединяете этот кадр с 5 предыдущими кадрами и 5 будущими кадрами. И метка для этого...
673 просмотров

VBA - сохранить речь SAPI в ДАННЫЙ тип файла?
Моя задача В приложениях Office можно использовать речь. Моя цель сохранить речь MS SAPI в файл заданного типа. Насколько я знаю, мой пример кода сохраняется в файл WAV. Проблема Я не знаю, можно ли определить только расширение...
2927 просмотров
schedule 02.11.2022

Облачные функции Google: require () не является функцией
Я пытаюсь развернуть функцию Google Cloud, я начал с добавления начальных требований в свой файл index.js: // Import the Google Cloud client libraries const nl = require('@google-cloud/language')(); const speech =...
4025 просмотров

Ошибка преобразования речи в текст в речевых службах Azure
У меня есть бесплатная пробная учетная запись служб речи Azure, и я использую службы преобразования речи в текст в программе, использующей C #. Утилита программы заключается в преобразовании аудио файлов в текстовые файлы с помощью API речи в...
200 просмотров