
С расширением приложений ИИ все большее внимание уделяется распознаванию диалектов. Однако из-за огромной разницы между китайскими диалектами и мандаринским диалектом распознавание речи китайских диалектов намного сложнее.
Вообще говоря, сбор речевых данных заключается в записи часто используемых предложений и слов с помощью текста, фонетических символов и голоса и интеграции записанного содержимого в базу данных. Однако многочисленные типы диалектов в Китае означают, что данные, которые необходимо собрать, также огромны, и трудно создать базу данных национальных диалектов за короткое время.
Для крупномасштабных приложений китайского диалекта Datatang подготовила заранее и накопила 25 000 часов данных о китайских диалектах, охватывающих диалектные регионы Фуцзянь, Гуандун, У , Хунань, юго-запад, северо-восток, центральные равнины и этнические меньшинства. Наборы данных могут быть доставлены за считанные секунды и быстро помогают повысить точность распознавания моделей ИИ. Все наборы данных записаны носителями языка с подписанными авторизационными соглашениями.

Данные разговорной речи на кантонском диалекте
В записи приняли участие около 1000 носителей кантонского диалекта, которые естественным образом общались лицом к лицу. У них была свободная дискуссия по ряду заданных тем в самых разных областях; голос был естественным и плавным, в соответствии с реальной сценой диалога.
Данные разговорной речи на миннанском диалекте
Он собирает около 1000 спикеров из провинции Фуцзянь. Указаны десятки тем, и говорящие ведут диалог по этим темам во время записи. Точность предложения составляет 95%.

Данные разговорной речи на сычуаньском диалекте
1730 носителей языка Сычуань участвовали в записи и свободном разговоре лицом к лицу естественным образом на широких полях без указания темы. Это естественно и бегло в речи, и в соответствии с фактической сценой диалога.
Если приведенные выше данные не могут удовлетворить потребности вашего текущего исследования, Datatang также предоставляет услуги по настройке данных для определенных групп людей, конкретных сценариев и конкретных языков для удовлетворения разнообразных потребностей клиентов в данных.
Конец
Если вам нужны услуги передачи данных, свяжитесь с нами: info@datatang.com