Семь вертикальных векторов диалогового ИИ

И какие инструменты доступны в каждом векторе

Введение

Недавно был опубликован отчет Магический квадрант Gartner для корпоративного диалогового ИИ. Чтобы компания или продукт были рассмотрены, необходимо было соответствовать определенным критериям. Одним из критериев квалификации для организации было наличие единственной автономной платформы.

Следовательно, Microsoft, которая хорошо известна и имеет большой портфель продуктов в области разговорного ИИ, не была включена. Его диалоговые ИИ-предложения Power Virtual Agents, Azure Bot Service и Bot Framework не предлагают единственную автономную платформу, поэтому Microsoft не соответствует требованиям для включения.

То же самое можно сказать и о NVIDIA Riva, которая придерживается аналогичного подхода Microsoft. Наличие предложений ИИ в TTS, STT, NLP и NLU. Но не имеет единственной автономной платформы.

Это не невыгодная, а преднамеренная стратегия, позволяющая предприятиям создавать индивидуальные, масштабируемые экосистемы диалогового ИИ с использованием независимых компонентов.

Точно так же есть нишевые софтверные компании, ориентированные на узкие направления.

Согласно недавнему отчету Deloitte, проблемы с настройкой, включая данные для обучения и обслуживание, были одной из основных причин отказа от внедрения чат-ботов на предприятиях.

При разработке чат-ботов первоначальные подходы, казалось, были сосредоточены вокруг одного поставщика или технологической структуры/стека для решения всего процесса разработки и обслуживания чат-бота от начала до конца.

Сейчас появляется подход к построению экосистемы чат-ботов с использованием различных технологий и компонентов. Следуя более открытому подходу и выбирая лучшее в своем классе для каждого отдельного компонента разговорного опыта.

Этот принцип проявляется в открытой архитектуре Cognigy, где каждый компонент их фреймворка может использоваться и реализовываться независимо.

Пример реализации вертикального вектора один

Наборы данных должны отражать часто встречающиеся языковые явления реальных чат-ботов. Эти явления могут включать грамматические и орфографические ошибки, повторение слов и предложений и отсутствие знаков препинания.

В приведенном ниже примере 100 000 высказываний были взяты из общедоступного набора данных и отправлены в HumanFirst без лингвистических флагов, без категорий или намерений.

С помощью HumanFirst была загружена только колонка высказывания

Как показано выше, группы намерений создаются путем группировки высказываний клиентов. Следовательно, создание предварительных намерений из высказываний клиентов. Пример того, как не начинать с «решения» и идти обратно.

Степень детализации определяет, насколько конкретными будут кластеры и сколько будет создано групп намерений. Высокая степень детализации очень специфична, увеличьте степень детализации, чтобы увидеть базовый тематический обзор разговоров.

Размер кластера может помочь исключить кластеры, в которых может быть недостаточно данных, чтобы составить намерение. Размер кластера также можно использовать для определения количества примеров в каждой группе намерений.

Семь вертикальных векторов в диалоговом ИИ

В ландшафте разговорного ИИ есть семь вертикальных векторов, а также горизонтальный вид. Вертикали можно разделить на три основные группы: до разговора, во время разговора и после разговора.

Семь вертикальных векторов перечислены выше, где ответы и переговоры состоят из NLU и персонализации. Вектор 5 – это во многом нишевый рынок, как и вектор 1.

Как было сказано во введении, крупные организации нередко строят свой ландшафт диалогового ИИ из различных технологий, выбирая лучшие в своем роде для каждой области интереса.

Горизонтальный взгляд на диалоговые экосистемы ИИ

В общих чертах ландшафт среды разработки чат-ботов можно разделить на четыре категории.

Важно принимать проницательные технологические решения. Позже в процессе эти инструменты будут формировать и влиять на то, как вы планируете, разрабатываете и масштабируете своего чат-бота. Препятствия обычно связаны с системой или платформой.

Инструменты и фреймворки для разработки чат-ботов можно разделить на четыре категории. Эти категории различаются по уровню и подходу к коду и области внимания.

Категория 1

Более технические инструменты НЛП с открытым исходным кодом и среды разработки чат-ботов. Может быть установлен где угодно, имеет открытую архитектуру и часто с открытым исходным кодом. Графический интерфейс, файл конфигурации и прокод отсутствуют или ограничены, ориентированы на машинное обучение. Во многих случаях более высокий барьер для входа хорошо масштабируется.

Эти среды требуют тщательного технического планирования установки и оперативного управления. Программное обеспечение Категории 3 часто используется в качестве базовой технологии, и можно разрабатывать новые функции и улучшать платформу.

Категория 2

Часто используется крупными коммерческими предложениями, облачными решениями, крупными технологическими компаниями. В некоторых случаях могут быть выбраны определенные географические регионы, которые рассматриваются как безопасные ставки для крупных организаций. Решения варьируются от pro-code, low-code до no-code. Более низкий барьер для входа, ориентированный на графический интерфейс и практически полное отсутствие понимания или контроля того, что происходит под капотом. Влияние пользователя на дорожную карту продукта практически отсутствует.

Жесткое управление состоянием диалога на основе правил, стоимость чаще всего не подлежит обсуждению, а основное внимание уделяется сотрудничеству и групповому дизайну-разработке.

Категория 3

Это независимые альтернативы разговорному ИИ, предоставляющие инкапсулированный продукт. Вспомогательная технология под капотом часто остается неизвестной. Независимые поставщики альтернативных решений, часто созданные с использованием инструментов НЛП с открытым исходным кодом. Часто используются инновационные подходы к задачам Dialog State Design, разработки и управления.

Подход с низким кодом к нулевому коду, существует вероятность того, что эти компании будут приобретены, цена часто более договорная. Запросы функций с большей вероятностью будут удовлетворены, ниже барьер для входа и начала работы.

Категория 4

Инструменты обработки и понимания естественного языка, текст или разговоры могут быть проанализированы на наличие намерений, именованных объектов, пользовательских определенных объектов. Часто могут выполняться такие задачи, как обобщение, извлечение ключевых слов, определение языка и т. д. В некоторых случаях доступны инструменты графического интерфейса для аннотирования данных и улучшения обучающих данных.

Кроме того, инструменты для управления данными обучения, легкодоступные, но с более высоким техническим барьером для входа и идеально подходящие для высоких NLP, передают пользовательский ввод до NLU. Не является средой разработки чат-ботов и не включает такие функции, как управление состоянием диалогов, управление ответами чат-ботов и т. д.

Сосредоточены на более широких реализациях обработки языка, а не только на диалоговых агентах, часто используются для автономной обработки диалогового текста не в режиме реального времени и часто используются в качестве базовой технологии программным обеспечением категории 3 .

Пример реализации вертикального вектора Seven

Ниже последний пример, в этом экземпляре вектора семь, где загружаются разговоры с клиентами.

Данные разговора должны иметь идентификатор разговора для каждого разговора, отметку времени, говорящего и текст диалогового хода.

Из диалоговых данных разговоры сегментируются, диалоговые пузыри видны, и можно начинать исследование данных и аннотирование.

Заключение

Выбор подходящего программного обеспечения и решений для любых задач, связанных с разговорным ИИ, становится все труднее. И выбор наиболее подходящего программного обеспечения для правильной вертикали имеет решающее значение.

Бывают случаи, когда некоторые решения охватывают несколько векторов. Бывают также случаи, когда специализированное программное обеспечение ориентировано на один или несколько векторов.

Согласно исследованию Deloitte, 20% патентов на разговорный ИИ связаны с улучшением процесса обучения. Инновации направлены на автоматизацию и ускорение процесса обучения, чтобы лучше понимать вводимые пользователями данные и повышать качество ответов.

Это исследование указывает на растущее внимание к векторам 1 и 7, и ответы на запросы клиентов могут улучшиться только в том случае, если будет улучшено понимание клиентов.



«Подпишитесь на мою рассылку.
НЛП/НЛУ, Чат-боты, Голос, Разговорный UI/UX, CX Designer, Разработчик, Вездесущие пользовательские интерфейсы, Ambient…кобусгрейлинг. мне"