Вчера на конференции Google For India 2018 в Нью-Дели компания Google запустила свою платформу искусственного интеллекта Navlekha, которая позволяет издателям делать офлайн-контент на индийском языке полностью редактируемым и упрощает процесс онлайн-публикации.

Navlekha использует технологию машинного обучения для преобразования PDF-файлов на индийском языке и отсканированных файлов в редактируемый текст, чтобы помочь издателям обмениваться контентом в Интернете. «Навлеха» происходит от санскрита, что означает «новый способ письма».

Индия является вторым по величине населением в мире пользователей Интернета, и каждый год их число увеличивается на 40 миллионов. Но многим индийским издателям не хватает технологий и каналов для публикации своего контента в Интернете. По оценкам Google, 90 процентов индийских издателей не имеют веб-сайтов для распространения контента, а количество контента на индийском языке в Интернете сейчас составляет лишь один процент от общего количества на английском языке.

Google также анонсировал новую функцию голосового веб-сайта в Google Go, которая использует NLP и синтез речи, чтобы позволить пользователям «слушать веб-сайты» даже при подключении 2G. Функция поддерживает 28 языков, включая хинди, бенгали, малаялам, маратхи и тамильский. Google также интегрировал удобные для хинди функции во флагманские продукты Google Search и Google Go, и пользователи в Индии теперь могут настраивать свои результаты поиска Google, чтобы они включали источники как на английском, так и на хинди.

Google ясно видит огромный потенциал для развития контента и услуг на местных языках на субконтиненте и планирует использовать машинное обучение, чтобы выйти на этот расширяющийся рынок.

Автор: Алекс Чен | Редактор: Майкл Саразен

Подпишитесь на нас в Twitter @Synced_Global, чтобы узнавать больше об искусственном интеллекте!

Подпишитесь на Synced Global AI Weekly, чтобы получать информативные технические новости, обзоры и анализ! Нажмите здесь!