Введение
Нужны ли нам экраны для взаимодействия с нашими компьютерами и смартфонами?
Ответ — нет, взаимодействие с компьютером простым нажатием кнопок на экране — это просто старый способ взаимодействия с компьютерной системой.
Теперь у нас есть такие технологии, как Amazon Alexa, Google Assistant и т. д. Эти технологии доступны на таких устройствах, как ваш телефон, смарт-телевизор, умные колонки, такие как Amazon Echo, Google home mini и т. д. Голосовые устройства становятся все более популярными с каждым днем.
Моя цель в написании этой статьи — обсудить происходящие в настоящее время изменения в области технологий и устройств, использующих голосовой пользовательский интерфейс (VUI), с особым акцентом на Alexa.
Мир движется к голосовому пользовательскому интерфейсу (VUI).
Прежде чем мы начнем этот раздел, позвольте мне задать вам несколько вопросов
- Вы когда-нибудь использовали Google Assistant/Siri/Alexa на своем телефоне?
- Вы когда-нибудь слушали подкаст?
- Вы когда-нибудь слушали аудиокнигу?
- Вы когда-нибудь проигрывали видео на YouTube и просто слушали звук?
Если ответы на приведенные выше вопросы «Да», то у вас не возникнет проблем с использованием Alexa или Google Assistant для заказа еды, бронирования авиабилетов, бронирования билетов в кино, бронирования Uber и т. д.
Теперь давайте посмотрим статистику по этим устройствам с поддержкой голосовой помощи.
- По данным Google, 20% всех поисковых запросов приходится на голос.
- 65% владельцев домов Amazon Echo или Google не хотят возвращаться к временам ввода с клавиатуры.
- 5% людей в возрасте от 16 до 24 лет используют голосовой поиск на своих мобильных устройствах.
- Люди в возрасте 26–35 лет чаще всего становятся владельцами умных колонок.
- 22% владельцев умных колонок купили что-то с помощью голосового поиска.
- 46% владельцев умных колонок каждый день используют голосовой поиск, чтобы найти компанию, расположенную поблизости.
- 20% мобильных запросов — это голосовой поиск.
для получения дополнительной статистики вы можете обратиться к 99firms.
Эти статистические данные в основном охватывают США, но Индия также находится на пути к адаптации этого изменения в технологии.
Когда я думаю о том, как Бхарат (сельская Индия) адаптируется к голосовым технологиям, мне приходит на ум сцена из фильма «Три идиота» (болливудский фильм).
В этой сцене, когда Раджу и Чатур спрашивают местного парня об адресе, написанном на листке бумаги.
Местный парень: «Бхаи сахаб падхна лихна аата тох бхуджа тоди на бехта».
Чатур- «иско падхна ни аати»
Раджу-"падхна ни аати пр болна тох аати хай на"
Здесь местный парень не может читать и писать по-английски, но может говорить на своем родном языке, поэтому, если технология позволит ему общаться на своем родном языке, он и миллионы других индийцев смогут использовать эту технологию с умом.
Технологические гиганты, такие как Google и Amazon, также обеспокоены применимостью голосовых технологий к местным языкам, поэтому они подталкивают разработчиков по всему миру к созданию таких вещей, как Alexa, на местных языках.
Навыки Alexa и их применение.
Сама Alexa способна вести беседы и давать основные сведения, такие как прогноз погоды, рассказывать анекдоты, но если вы углубитесь в то, на что способна Alexa, вы столкнетесь с Alexa Skills. Проще говоря, вы можете понять эти навыки, связав их с приложениями для Android в магазине Google Play. То, как разработчики создают приложения для Android и размещают их в магазине игр, точно так же разработчики могут создавать свои собственные навыки Alexa и размещать их в магазине навыков Alexa.
Это скриншот домашней страницы магазина навыков Alexa, который вы можете посетить и активировать навыки по вашему выбору.
Alexa не ограничивается только эхо-устройствами или другими сторонними устройствами, вы также можете использовать Alexa на своем телефоне Android, загрузив мобильное приложение Alexa из магазина Google Play.
Здесь вы можете перемещаться по поиску навыков и использовать различные навыки, а также управлять другими устройствами с поддержкой Alexa через свой телефон.
Теперь давайте обсудим возможности навыков Alexa. Предположим, вы бронируете билет в кино с помощью Alexa, тогда ассистент спросит вас, следует ли ей заказать Uber в театр, а также следует ли ей зарезервировать столик в ближайшем ресторане. Вы можете увидеть надлежащую демонстрацию этого в этом видео, в программной речи г-на Рохита Прасада (вице-президента и главного научного сотрудника Alexa) на re:MARS (мероприятие Amazon).
Alexa может выполнять такую задачу, понимая поведение клиентов, например, для вышеуказанного набора навыков давайте предположим, как клиенты ведут себя раньше, чтобы спланировать вечер, сначала они бронируют билет, затем они заказывают убер, а затем они ищут поблизости ресторан. Поскольку большое количество потребителей использует навыки в этом конкретном порядке, и цель состоит в том, чтобы сделать Alexa более естественной и разговорной, алгоритмы разработаны таким образом, что сама Alexa предлагает эти навыки последовательно, чтобы сделать взаимодействие с пользователем плавным и эффективным.
Алекса в Индии
По словам г-на Према Натараджана, как он сказал в программной речи voxcon India, главная задача для компании состоит в том, чтобы сделать Alexa более релевантной на местном уровне за счет местной релевантности. Я имею в виду, что в Индии большинство потребителей говорят на нескольких языках, поэтому при разговоре с Alexa, если клиент использует слово «резинка», то Алекса должен быть в состоянии распознать, имеет ли он в виду слово на хинди, которое означает «грустный» или «жевательные резинки».
Г-н Прем также подчеркнул, что добавление хинди в Alexa само по себе было очень сложной задачей, потому что хинди как язык используется людьми здесь, в Индии, по-разному, а тон и произношение очень сильно меняются, когда мы переходим из одного места в другое. Самое интересное, что я обнаружил, когда речь идет о потребительском поведении здесь, в Индии, это то, что сами семьи очень разные, так как в семье из трех человек муж из Ченнаи, жена из Дели, и у них рождается и воспитывается ребенок. в Ахмадабаде эта семья будет использовать одно и то же устройство Alexa, и у всех троих разные акценты, что само по себе является проблемой для устройства, работающего на разговорном ИИ. В Индии миллион таких вариантов использования.
Вы можете посмотреть рекламу Alexa на YouTube, чтобы увидеть различные варианты использования, на которые нацелена компания, во время просмотра этой рекламы. Я бы посоветовал вам думать как разработчик, а не как потребитель, и вы увидите, что все они демонстрируют совершенно разную динамику.
Есть 5 столпов, на которых Alexa функционирует и становится все более и более актуальной для людей:
- Осведомленность о контексте
Alexa становится все более и более контекстно-зависимой, т. е. более правильно понимает намерения, например:
Ты: «Алекса, как сегодня погода?»
Alexa- «Солнечно, 27 градусов по Цельсию» (что-то в этом роде)
Ты: «А что насчет завтра?»
Обратите внимание здесь, в приведенном выше диалоге, когда вы не упомянули контекст во втором вопросе, который вы задаете о погоде, но Alexa учитывает контекст, то есть она знает, что это обсуждение о погоде в Дели, поэтому она дает соответствующий ответ. .
2. Естественность
Видение состоит в том, чтобы заставить Алексу вести себя как один из членов семьи, поэтому для нее гораздо важнее действовать и вести себя как один из них.
В том же мероприятии voxcon India есть диалог между мистером Дилипом Р.С. и Алексой.
Дилип: «Alexa kya haal hai?»
Алекса: «Bas aapne puvh lia dil garden-garden ho gya!»
Это тот тип индийской сенсорной компании, к которому стремится, конечно, вы никогда не примете устройство Alexa, которое произносит Свами Вивекананд и Сачин Тендулкар так, как это сделал президент Дональд Трамп во время своего недавнего визита в Индию.
3. Самообучение
Самообучение является основной опорой любого устройства на основе ИИ. В случае с Alexa мы можем обсудить некоторые варианты использования, например, когда вы говорите «Alexa закажи мне такси», Alexa должна быть достаточно умна, чтобы не задавать никаких дополнительных вопросов, таких как « ола или убер?» она должна заказать такси, проанализировав ваши личные предпочтения, которые у нее уже есть.
Другой случай, когда дети просят Алексу «играть песенку с азбукой» вместо «алфавитной песни», и она исправляется один или два раза. Теперь Alexa достаточно умна, чтобы воспроизводить песню Alphabet всякий раз, когда в следующий раз будет запрашиваться песня ABC.
4. Знающий
Когда дело доходит до устройства, которое должно использоваться во всем мире, знание местных условий очень важно, так как в Индии, если кто-то спрашивает счет у Alexa, то он почти уверен, что он спрашивает о счете в крикете. Ответы на некоторые вопросы различны для разных мест в мире. Для достижения мечты об Искусственном общем интеллекте системы должны быть максимально информативными.
5. Компетентность
Компетентность означает способность выполнять задачи. Alexa становится все более и более компетентной, это связано с усилиями разработчиков по всему миру, которые сделали почти 90000+ навыков, и из этих 30000+ навыков доступны в Индии.
Alexa теперь также может выполнять несколько действий, таких как «Alexa включает поп-музыку и приглушает свет». в этом утверждении одновременно даются две разные команды, и Alexa теперь достаточно компетентна, чтобы выполнять их обе вместе.
Вывод
В заключение я хотел бы сказать всем разработчикам, что у нас есть огромные возможности в этой области, поскольку вы можете легко научиться развивать навыки Alexa, у вас также есть шанс создать что-то на своем родном языке, и в будущем вы также можете подать заявку на стать влиятельным лицом Alexa, что имеет свои преимущества.
«Лучший способ предсказать будущее — быть в курсе сегодня»
Этой цитатой я хотел бы сказать, что все мы знаем, что разговорный ИИ — это следующее большое событие в отрасли, поэтому давайте внесем свой вклад в эту революцию в области эмбиентных вычислений.