Введение

Нужны ли нам экраны для взаимодействия с нашими компьютерами и смартфонами?

Ответ — нет, взаимодействие с компьютером простым нажатием кнопок на экране — это просто старый способ взаимодействия с компьютерной системой.

Теперь у нас есть такие технологии, как Amazon Alexa, Google Assistant и т. д. Эти технологии доступны на таких устройствах, как ваш телефон, смарт-телевизор, умные колонки, такие как Amazon Echo, Google home mini и т. д. Голосовые устройства становятся все более популярными с каждым днем.

Моя цель в написании этой статьи — обсудить происходящие в настоящее время изменения в области технологий и устройств, использующих голосовой пользовательский интерфейс (VUI), с особым акцентом на Alexa.

Мир движется к голосовому пользовательскому интерфейсу (VUI).

Прежде чем мы начнем этот раздел, позвольте мне задать вам несколько вопросов

  1. Вы когда-нибудь использовали Google Assistant/Siri/Alexa на своем телефоне?
  2. Вы когда-нибудь слушали подкаст?
  3. Вы когда-нибудь слушали аудиокнигу?
  4. Вы когда-нибудь проигрывали видео на YouTube и просто слушали звук?

Если ответы на приведенные выше вопросы «Да», то у вас не возникнет проблем с использованием Alexa или Google Assistant для заказа еды, бронирования авиабилетов, бронирования билетов в кино, бронирования Uber и т. д.

Теперь давайте посмотрим статистику по этим устройствам с поддержкой голосовой помощи.

  1. По данным Google, 20% всех поисковых запросов приходится на голос.
  2. 65% владельцев домов Amazon Echo или Google не хотят возвращаться к временам ввода с клавиатуры.
  3. 5% людей в возрасте от 16 до 24 лет используют голосовой поиск на своих мобильных устройствах.
  4. Люди в возрасте 26–35 лет чаще всего становятся владельцами умных колонок.
  5. 22% владельцев умных колонок купили что-то с помощью голосового поиска.
  6. 46% владельцев умных колонок каждый день используют голосовой поиск, чтобы найти компанию, расположенную поблизости.
  7. 20% мобильных запросов — это голосовой поиск.

для получения дополнительной статистики вы можете обратиться к 99firms.

Эти статистические данные в основном охватывают США, но Индия также находится на пути к адаптации этого изменения в технологии.

Когда я думаю о том, как Бхарат (сельская Индия) адаптируется к голосовым технологиям, мне приходит на ум сцена из фильма «Три идиота» (болливудский фильм).

В этой сцене, когда Раджу и Чатур спрашивают местного парня об адресе, написанном на листке бумаги.

Местный парень: «Бхаи сахаб падхна лихна аата тох бхуджа тоди на бехта».

Чатур- «иско падхна ни аати»

Раджу-"падхна ни аати пр болна тох аати хай на"

Здесь местный парень не может читать и писать по-английски, но может говорить на своем родном языке, поэтому, если технология позволит ему общаться на своем родном языке, он и миллионы других индийцев смогут использовать эту технологию с умом.

Технологические гиганты, такие как Google и Amazon, также обеспокоены применимостью голосовых технологий к местным языкам, поэтому они подталкивают разработчиков по всему миру к созданию таких вещей, как Alexa, на местных языках.

Навыки Alexa и их применение.

Сама Alexa способна вести беседы и давать основные сведения, такие как прогноз погоды, рассказывать анекдоты, но если вы углубитесь в то, на что способна Alexa, вы столкнетесь с Alexa Skills. Проще говоря, вы можете понять эти навыки, связав их с приложениями для Android в магазине Google Play. То, как разработчики создают приложения для Android и размещают их в магазине игр, точно так же разработчики могут создавать свои собственные навыки Alexa и размещать их в магазине навыков Alexa.

Это скриншот домашней страницы магазина навыков Alexa, который вы можете посетить и активировать навыки по вашему выбору.

Alexa не ограничивается только эхо-устройствами или другими сторонними устройствами, вы также можете использовать Alexa на своем телефоне Android, загрузив мобильное приложение Alexa из магазина Google Play.

Здесь вы можете перемещаться по поиску навыков и использовать различные навыки, а также управлять другими устройствами с поддержкой Alexa через свой телефон.

Теперь давайте обсудим возможности навыков Alexa. Предположим, вы бронируете билет в кино с помощью Alexa, тогда ассистент спросит вас, следует ли ей заказать Uber в театр, а также следует ли ей зарезервировать столик в ближайшем ресторане. Вы можете увидеть надлежащую демонстрацию этого в этом видео, в программной речи г-на Рохита Прасада (вице-президента и главного научного сотрудника Alexa) на re:MARS (мероприятие Amazon).

Alexa может выполнять такую ​​задачу, понимая поведение клиентов, например, для вышеуказанного набора навыков давайте предположим, как клиенты ведут себя раньше, чтобы спланировать вечер, сначала они бронируют билет, затем они заказывают убер, а затем они ищут поблизости ресторан. Поскольку большое количество потребителей использует навыки в этом конкретном порядке, и цель состоит в том, чтобы сделать Alexa более естественной и разговорной, алгоритмы разработаны таким образом, что сама Alexa предлагает эти навыки последовательно, чтобы сделать взаимодействие с пользователем плавным и эффективным.

Алекса в Индии

По словам г-на Према Натараджана, как он сказал в программной речи voxcon India, главная задача для компании состоит в том, чтобы сделать Alexa более релевантной на местном уровне за счет местной релевантности. Я имею в виду, что в Индии большинство потребителей говорят на нескольких языках, поэтому при разговоре с Alexa, если клиент использует слово «резинка», то Алекса должен быть в состоянии распознать, имеет ли он в виду слово на хинди, которое означает «грустный» или «жевательные резинки».

Г-н Прем также подчеркнул, что добавление хинди в Alexa само по себе было очень сложной задачей, потому что хинди как язык используется людьми здесь, в Индии, по-разному, а тон и произношение очень сильно меняются, когда мы переходим из одного места в другое. Самое интересное, что я обнаружил, когда речь идет о потребительском поведении здесь, в Индии, это то, что сами семьи очень разные, так как в семье из трех человек муж из Ченнаи, жена из Дели, и у них рождается и воспитывается ребенок. в Ахмадабаде эта семья будет использовать одно и то же устройство Alexa, и у всех троих разные акценты, что само по себе является проблемой для устройства, работающего на разговорном ИИ. В Индии миллион таких вариантов использования.

Вы можете посмотреть рекламу Alexa на YouTube, чтобы увидеть различные варианты использования, на которые нацелена компания, во время просмотра этой рекламы. Я бы посоветовал вам думать как разработчик, а не как потребитель, и вы увидите, что все они демонстрируют совершенно разную динамику.

Есть 5 столпов, на которых Alexa функционирует и становится все более и более актуальной для людей:

  1. Осведомленность о контексте

Alexa становится все более и более контекстно-зависимой, т. е. более правильно понимает намерения, например:

Ты: «Алекса, как сегодня погода?»

Alexa- «Солнечно, 27 градусов по Цельсию» (что-то в этом роде)

Ты: «А что насчет завтра?»

Обратите внимание здесь, в приведенном выше диалоге, когда вы не упомянули контекст во втором вопросе, который вы задаете о погоде, но Alexa учитывает контекст, то есть она знает, что это обсуждение о погоде в Дели, поэтому она дает соответствующий ответ. .

2. Естественность

Видение состоит в том, чтобы заставить Алексу вести себя как один из членов семьи, поэтому для нее гораздо важнее действовать и вести себя как один из них.

В том же мероприятии voxcon India есть диалог между мистером Дилипом Р.С. и Алексой.

Дилип: «Alexa kya haal hai?»

Алекса: «Bas aapne puvh lia dil garden-garden ho gya!»

Это тот тип индийской сенсорной компании, к которому стремится, конечно, вы никогда не примете устройство Alexa, которое произносит Свами Вивекананд и Сачин Тендулкар так, как это сделал президент Дональд Трамп во время своего недавнего визита в Индию.

3. Самообучение

Самообучение является основной опорой любого устройства на основе ИИ. В случае с Alexa мы можем обсудить некоторые варианты использования, например, когда вы говорите «Alexa закажи мне такси», Alexa должна быть достаточно умна, чтобы не задавать никаких дополнительных вопросов, таких как « ола или убер?» она должна заказать такси, проанализировав ваши личные предпочтения, которые у нее уже есть.

Другой случай, когда дети просят Алексу «играть песенку с азбукой» вместо «алфавитной песни», и она исправляется один или два раза. Теперь Alexa достаточно умна, чтобы воспроизводить песню Alphabet всякий раз, когда в следующий раз будет запрашиваться песня ABC.

4. Знающий

Когда дело доходит до устройства, которое должно использоваться во всем мире, знание местных условий очень важно, так как в Индии, если кто-то спрашивает счет у Alexa, то он почти уверен, что он спрашивает о счете в крикете. Ответы на некоторые вопросы различны для разных мест в мире. Для достижения мечты об Искусственном общем интеллекте системы должны быть максимально информативными.

5. Компетентность

Компетентность означает способность выполнять задачи. Alexa становится все более и более компетентной, это связано с усилиями разработчиков по всему миру, которые сделали почти 90000+ навыков, и из этих 30000+ навыков доступны в Индии.

Alexa теперь также может выполнять несколько действий, таких как «Alexa включает поп-музыку и приглушает свет». в этом утверждении одновременно даются две разные команды, и Alexa теперь достаточно компетентна, чтобы выполнять их обе вместе.

Вывод

В заключение я хотел бы сказать всем разработчикам, что у нас есть огромные возможности в этой области, поскольку вы можете легко научиться развивать навыки Alexa, у вас также есть шанс создать что-то на своем родном языке, и в будущем вы также можете подать заявку на стать влиятельным лицом Alexa, что имеет свои преимущества.

«Лучший способ предсказать будущее — быть в курсе сегодня»

Этой цитатой я хотел бы сказать, что все мы знаем, что разговорный ИИ — это следующее большое событие в отрасли, поэтому давайте внесем свой вклад в эту революцию в области эмбиентных вычислений.