Общий жизненный цикл AI/ML состоит из сбора данных, подготовки, обучения, оценки, развертывания и мониторинга, и все это включено в конвейер MLOps.

Генеративный ИИ (GenAI) — это трансформационная технология, которая в ближайшие месяцы и годы продолжит оказывать влияние на основные изменения в отрасли. В настоящее время на ранних стадиях он вызвал много шума; отвлечение на фундаментальный сдвиг, лежащий в основе его обещаний.

Использование генеративного ИИ на предприятии воспроизводимым, масштабируемым и ответственным образом, сводящим к минимуму риски, связанные с безопасностью ИИ, предотвращением злоупотреблений и надежностью модели, требует расширения общего жизненного цикла машинного обучения.

В этой статье мы рассмотрим первоначальный набор нюансов и дополнений, необходимых для внедрения генеративного ИИ на предприятии.

Давайте начнем с сопоставления нескольких терминов в спектре AI/ML.

Прогнозирующий ИИ и Генеративный ИИ

Генеративный ИИ и прогнозирующий ИИ — это два разных типа искусственного интеллекта (ИИ), которые используются для разных целей. Генеративный ИИ используется для создания нового контента, такого как музыка, изображения и тексты, в то время как прогнозирующий ИИ используется для кластеризации, классификации и регрессии, которые часто основаны на контролируемом обучении и исторических обучающих наборах, которые создают модели для прогнозов будущих состояний или событий. Например, прогнозирующая модель ИИ, обученная на наборе исторических данных о фондовом рынке, может делать прогнозы относительно будущих цен на акции.

Генеративные модели ИИ строятся путем обучения на большом наборе данных общих примеров (таких как wikipedia, commoncrawl и т. д.), а затем с использованием этих знаний для создания новых примеров, похожих на обучающие данные. Итак, идея состоит в том, чтобы генерировать новые данные. Генеративная модель ИИ, обученная на наборе данных изображений кошек, может генерировать новые изображения кошек, похожие на данные обучения.

Генеративные модели ИИ часто используются в творческих приложениях, таких как создание новых произведений искусства или музыки. Прогнозирующие модели ИИ часто используются в бизнес-приложениях, таких как прогнозирование поведения клиентов или принятие финансовых решений.

Как генеративный, так и предсказательный ИИ могут во многих отношениях улучшить нашу жизнь. Генеративные модели ИИ можно использовать для создания новых продуктов и услуг, автоматизации задач и повышения эффективности бизнеса. Прогнозирующие модели ИИ можно использовать для принятия более взвешенных решений, улучшения обслуживания клиентов и предотвращения преступлений.

Однако как модели генеративного ИИ, так и модели прогнозирующего ИИ также могут быть использованы в вредоносных целях. Генеративные модели ИИ можно использовать для создания фейковых новостей или распространения дезинформации. Прогнозирующие модели ИИ могут использоваться для дискриминации людей или вторжения в их частную жизнь.

Давайте выделим контрастирующие аспекты между генеративным и прогнозирующим ИИ:

Генеративный ИИ:

  • Основное внимание уделяется созданию нового контента, такого как музыка, изображения и тексты, с использованием алгоритмов глубокого обучения, часто посредством эмерджентного поведения больших языковых моделей (LLM).
  • Включает обучение на большом наборе данных общих примеров (таких как Википедия, CommonCrawl и т. д.) и использование этих знаний для создания новых примеров, аналогичных обучающим данным.
  • Используется в творческих приложениях, таких как создание новых произведений искусства или музыки.
  • Требуется воспроизводимый, масштабируемый и ответственный подход, который сводит к минимуму риски безопасности ИИ, предотвращения злоупотреблений и надежности модели.
  • Требуется сбор данных, подготовка, обучение, оценка, развертывание и мониторинг, все это включено в конвейер MLOps, но с определенными нюансами и дополнениями, необходимыми для внедрения генеративного ИИ на предприятии.

Прогнозирующий ИИ:

  • Основное внимание уделяется прогнозированию будущих состояний или событий, часто полагаясь на контролируемое обучение и исторические обучающие наборы, которые создают модели для кластеризации, классификации и регрессии.
  • Включает обучение набору исторических данных и построение прогнозов на основе этих данных.
  • Используется в бизнес-приложениях, таких как прогнозирование поведения клиентов или принятие финансовых решений.
  • Требуется воспроизводимый, масштабируемый и ответственный подход, который сводит к минимуму риски безопасности ИИ, предотвращения злоупотреблений и надежности модели.
  • Требуется сбор данных, подготовка, обучение, оценка, развертывание и мониторинг, все это включено в конвейер MLOps, но с определенными нюансами и дополнениями, необходимыми для внедрения прогнозирующего ИИ на предприятии.

Ответственный ИИ

Независимо от того, используем ли мы предсказательный или генеративный ИИ, нам необходимо использовать принципы ответственного ИИ. Важно ответственно использовать модели ИИ и осознавать потенциальные риски, а также способы их проверки и смягчения. Нам необходимо внедрить и разработать этические принципы, которые минимизируют проблемы безопасности ИИ, препятствуют злоупотреблению/неправильному использованию моделей ИИ, а также отслеживают и защищают надежность моделей для разработки и использования этих технологий.

Как подполе ИИ, генеративный ИИ фокусируется на создании нового контента, такого как музыка, изображения и тексты, с использованием алгоритмов глубокого обучения, часто посредством эмерджентного поведения больших [языковых] моделей. (LLM). Это быстро развивающаяся область, в которой применяются самые разные приложения — от искусства и развлечений до научных открытий и создания маркетингового контента.

Как быстро развивающаяся область с потенциалом революционизировать многие отрасли, мы должны осознавать не только обещания, но и проблемы, которые необходимо решить, и взвесить компромиссы, прежде чем генеративный ИИ сможет получить широкое распространение, что он и сделает, как шлюзы. усыновления уже открыты и шумихи изобилует. Среди безумия и шума по-прежнему важно продолжать разработку генеративных моделей ИИ, которые были бы честными, точными, безопасными и надежными. Также важно следить и выступать за разработку правил, которые помогут обеспечить ответственное использование генеративного ИИ.

Генеративный жизненный цикл ИИ

На рисунке 1 ниже показан общий жизненный цикл GenAI.

Теперь давайте углубимся в каждую из основных фаз жизненного цикла и получим представление об этой стадии, ее задачах и основных нюансах и соображениях, которые могут быть более или менее специфичными для GenAI.

Сбор и подготовка данных

  • Сбор данных. Собирайте данные из различных источников, включая Интернет, социальные сети, датчики и оптимально хранилища данных, такие как Google BigQuery или Google Cloud Storage. При сборе данных для обучения генеративных моделей ИИ убедитесь, что набор данных представляет широкий спектр точек зрения, опыта и источников. Будьте осторожны, полагаясь исключительно на данные из одного источника или домена, так как это может привести к предвзятости.
  • Создание данных. При необходимости создавайте/используйте синтетические данные для дополнения существующих наборов данных, чтобы повысить показатели производительности обученных моделей.
  • Курирование данных. Очищайте и упорядочивайте данные с помощью фильтрации, преобразования, интеграции и маркировки данных для контролируемого обучения. Программная маркировка может быть незаменимой частью того, как мы можем ускорить обучение и тонкую настройку.
  • Хранилище функций. Храните золотой стандарт функций, тщательно подобранных и подготовленных. Мы делаем это в первую очередь для управления и согласованности ИИ на предприятии и возможном проекте, который будет к нему привязан; мы хотим хранить и управлять функциями, используемыми при обучении и выводе; часто различают статические и динамические или возможности хранения функций времени обучения и времени выполнения. Ищем ответы на вопросы команд разработчиков: Откуда мы взяли данные? Кто трогал данные? Они предвзято относились к данным во время курирования/маркировки? Например, вы можете использовать Vertex AI Feature Store для поддержки этой задачи.
  • Проверка смещения данных. Это важный шаг в жизненном цикле машинного обучения, особенно для генеративных моделей ИИ, чтобы гарантировать, что обучающие данные и сгенерированный контент являются достоверными, непредвзятыми и репрезентативными для базового распределения данных. Предвзятость в генеративных моделях ИИ может привести к созданию результатов, которые усиливают стереотипы, дискриминируют определенные группы или искажают реальность. Мы можем устранить предвзятость данных в прогнозирующем и генеративном ИИ сразу после сбора и обработки данных. Включив проверки смещения данных в жизненный цикл машинного обучения для генеративного ИИ, мы можем работать над созданием моделей, которые генерируют честный, беспристрастный и репрезентативный контент, в конечном итоге гарантируя, что разрабатываемые нами системы ИИ соответствуют этическим принципам и принципам. общественные ценности.

Проверка данных: Изучите собранные данные, чтобы выявить потенциальные отклонения или дисбалансы. Это можно сделать с помощью исследовательского анализа данных, визуализации или статистических тестов. Проанализируйте данные на наличие потенциальных проблем, таких как недостаточное представление определенных групп, чрезмерное представление определенных тем или искаженное распределение настроений.

Методы устранения погрешностей: Применяйте различные методы для устранения выявленных погрешностей в данных. Эти методы могут включать повторную выборку, повторное взвешивание или создание синтетических примеров для балансировки набора данных. Кроме того, рассмотрите возможность использования алгоритмов устранения смещения во время процесса обучения модели, чтобы свести к минимуму влияние смещений на выходные данные модели.

Оценка модели: разработайте метрики и методы оценки, которые конкретно оценивают справедливость и предвзятость модели. Это может включать измерение производительности модели в различных демографических группах, оценку разнообразия сгенерированных выборок или анализ поведения модели при получении подсказок, которые склонны к предвзятым выводам.

Непрерывный мониторинг. После развертывания генеративной модели ИИ отслеживайте ее производительность и результаты, чтобы убедиться, что с течением времени не возникают предубеждения. Настройте циклы обратной связи для сбора отзывов и предложений пользователей, которые можно использовать для выявления и устранения любых вновь обнаруженных предубеждений.

Прозрачность и подотчетность: документируйте и делитесь шагами, предпринятыми для устранения предвзятости данных в генеративной модели ИИ. Сообщайте конечным пользователям и заинтересованным сторонам об ограничениях модели и потенциальных предубеждениях, укрепляя доверие и устанавливая реалистичные ожидания в отношении производительности модели.

Обучение модели и эксперименты

  • Экспериментирование: это название игры в машинном обучении.
  • Обучение предварительно обученной модели: обучение модели с использованием предварительно обученной модели в качестве отправной точки.
  • Точная настройка моделей: обновите существующую модель новыми данными или для новой задачи.
  • Реестр моделей: это средство и механизм управления моделью и управления рисками модели. Чтобы использовать реестр моделей, мы будем хранить и управлять моделями для управления версиями, повторного использования и аудита, помечая метаданные модели, чтобы увидеть, откуда были получены данные (происхождение данных, родословная), как модель была обучена и т. д.

Распределенное обучение

  • Параллелизм данных: разделяйте данные на несколько устройств и обучайте их одновременно, чтобы ускорить обучение.
  • Параллелизм моделей: разделение модели на несколько устройств и их одновременное обучение для размещения в памяти более крупных моделей.
  • Федеративное обучение: совместно обучайте модели на нескольких устройствах или в разных организациях, сохраняя при этом конфиденциальность и безопасность.

Адаптация модели

Трансферное обучение

Адаптировать предварительно обученную модель к новой области или задаче

Точная настройка моделей

Обновите существующую модель новыми данными или для новой задачи

Снижение безопасности ИИ

Убедитесь, что модель безопасна, этична и заслуживает доверия, уменьшив вероятность неправильного использования, повысив надежность и обеспечив конфиденциальность и безопасность.

Дистилляция

Обучите или создайте гораздо меньшую модель с аналогичной производительностью и возможностями выполнения последующих задач, используя подход к обучению нескольких учеников и преподавателей, чтобы обучить гораздо меньшую модель или сократить модель, чтобы получить развертываемую модель меньшего размера.

Существует несколько методов перегонки больших языковых моделей (LLM) для получения моделей значительно меньшего размера с сопоставимой производительностью. Давайте рассмотрим некоторые распространенные подходы.

  1. Сокращение. Это включает в себя удаление ненужных весов или нейронов из LLM при сохранении его точности. Сокращение может быть выполнено с использованием различных методов, таких как сокращение на основе величины, сокращение на основе чувствительности и перемотка веса.
  2. Квантование: включает снижение точности весов и активаций LLM. Например, веса, которые изначально были представлены в виде 32-битных чисел с плавающей запятой, могут быть преобразованы в 8-битные целые числа. Это уменьшает объем памяти модели без существенного влияния на ее производительность.
  3. Дистилляция знаний. Это включает в себя обучение модели меньшего размера для имитации выходных данных LLM на наборе обучающих примеров. Идея состоит в том, чтобы перенести знания из большей модели в меньшую. Этот подход можно использовать для обучения моделей, которые на несколько порядков меньше исходной модели, лишь с небольшим снижением точности.
  4. Факторизация низкого ранга. Это включает в себя разложение весовых матриц LLM на матрицы низкого ранга. Это уменьшает количество параметров в модели, сохраняя при этом ее точность.
  5. Компактные вложения. Это включает уменьшение размерности входных и выходных вложений LLM. Это уменьшает количество параметров в модели и ускоряет вывод.
  6. Архитектурные изменения. Это связано с изменением архитектуры LLM, чтобы сделать ее более эффективной. Например, можно изменить архитектуру преобразователя, чтобы уменьшить занимаемую им память, или уменьшить количество головок внимания.
  7. Совместное использование параметров: включает совместное использование параметров различными частями модели. Например, одну и ту же матрицу весов можно использовать для нескольких слоев нейронной сети, уменьшая количество параметров и повышая эффективность модели.

В зависимости от конкретного варианта использования комбинация этих методов может использоваться для достижения желаемого уровня производительности и эффективности.

Другой подход - это подход «учитель-ученик» с несколькими выстрелами для создания моделей меньшего размера. Этот подход на самом деле является вариантом дистилляции знаний, но он специально фокусируется на обучении за несколько шагов — способности учиться на небольшом количестве примеров.

В подходе «учитель-ученик» [1] с несколькими выстрелами большой LLM (модель учителя) используется для создания синтетических примеров, которые используются для обучения меньшего LLM (модель ученика). Идея состоит в том, чтобы использовать модель учителя для создания примеров, представляющих основное распространение естественного языка, даже если модель ученика обучается только на небольшом количестве примеров.

Процесс «учитель-ученик» включает в себя следующие этапы:

  1. Обучите большой LLM (модель учителя) на большом корпусе текстов.
  2. Создавайте синтетические примеры, используя модель учителя, либо путем выборки из распределения модели, либо с помощью конкретных подсказок.
  3. Обучите меньший LLM (модель ученика) на небольшом количестве помеченных примеров вместе с синтетическими примерами, сгенерированными моделью учителя.
  4. Настройте модель ученика на небольшом проверочном наборе, чтобы оптимизировать ее производительность.

Подход «учитель-ученик с несколькими выстрелами» может значительно сократить количество примеров, необходимых для обучения высококачественного LLM. Это особенно полезно в сценариях, где мало помеченных примеров или когда требуется точная настройка для определенных доменов или задач. Однако следует отметить, что качество синтетических примеров, созданных моделью учителя, может повлиять на производительность модели ученика. Поэтому важно тщательно оценить качество синтетических примеров, прежде чем использовать их для обучения модели ученика.

Развертывание модели

Давайте обсудим, как обслуживать модель с помощью конечной точки Google Cloud’s Vertex AI. Обслуживание модели в конечной точке Vertex AI включает упаковку модели в образ контейнера, загрузку образа в реестр контейнеров, создание ресурса модели и конечной точки в консоли Vertex AI, развертывание модели в конечной точке, тестирование конечной точки и мониторинг. его производительность.

  1. Подготовьте модель. Во-первых, вам нужно подготовить обученную модель к развертыванию. Обычно это включает упаковку модели и любых необходимых зависимостей в образ контейнера, например образ Docker.
  2. Загрузить образ контейнера. Затем вам нужно загрузить образ контейнера в реестр контейнеров, например Google Container Registry. Это позволит вам легко развернуть образ на конечной точке Vertex AI.
  3. Создайте ресурс модели. В консоли Vertex AI создайте ресурс модели, который будет представлять вашу развернутую модель. Это включает в себя указание имени модели, описания и любых других метаданных, которые могут потребоваться.
  4. Создайте конечную точку. Создайте конечную точку Vertex AI для обслуживания вашей модели. Это включает в себя указание имени конечной точки, описание и регион, в котором она будет развернута.
  5. Разверните модель. После создания конечной точки вы можете развернуть свою модель в конечной точке. Это включает в себя указание используемого образа контейнера и любых необходимых параметров, таких как количество развертываемых реплик.
  • Пограничные вычисления. Разверните модели на периферийных устройствах для обеспечения малой задержки, сохранения конфиденциальности и получения логических выводов в реальном времени. Модели дистилляции для периферийных вычислений, такие как LLM или базовые модели, в целом огромны и не помещаются на небольшие устройства.
  • Облачное развертывание. Развертывание моделей на облачных платформах для обеспечения масштабируемости, доступности и экономичности

5.1 Протестируйте конечную точку. После развертывания модели вы можете протестировать конечную точку, отправив ей образцы запросов. Это позволит вам убедиться, что конечная точка правильно обслуживает модель и что модель генерирует точные прогнозы.

5.2 Мониторинг конечной точки. После развертывания конечной точки следует отслеживать ее производительность, чтобы убедиться, что она соответствует требуемым соглашениям об уровне обслуживания (SLA). Это может включать в себя мониторинг задержки, пропускной способности и количества ошибок, а также внесение корректировок по мере необходимости.
Мониторинг и управление. Мониторинг производительности модели, обнаружение проблем и обеспечение соблюдения правил и политик.

6. Сервировка

Вот несколько соображений по обслуживанию модели или запуску логического вывода/генерации контента:

  1. Подготовьте входные данные. После загрузки модели следующим шагом будет подготовка входных данных, которые будут загружены в модель. Это может включать предварительную обработку входных данных, например преобразование текста в числовые вложения или изменение размера изображений.
  2. Подача входных данных в модель. После того, как входные данные подготовлены, их можно передать в загруженную модель для вывода. Обычно это включает в себя вызов метода модели predict или generate и передачу входных данных.
  3. Создать выходные данные. Затем модель создаст выходные данные на основе входных данных. Выходные данные могут принимать разные формы в зависимости от конкретной задачи и архитектуры модели. Например, генеративная текстовая модель может генерировать последовательность слов или предложений, тогда как генеративная модель изображения может генерировать изображение или последовательность изображений.
  4. Постобработка вывода. После создания выходных данных может потребоваться постобработка, чтобы их можно было использовать для последующих задач. Это может включать преобразование вывода числовых вложений в текст, изменение размера изображений или применение других преобразований.

Обслуживание модели

  • Дрейф данных и модели. Мониторинг и управление изменениями в распределении данных и производительности модели с течением времени
  • Версионность модели. Управление различными версиями модели для прослеживаемости, воспроизводимости и сравнения
  • Настройка подсказок, дизайн подсказок: оптимизация подсказок, используемых в моделях генерации языка, для повышения качества, согласованности и релевантности.

Оптимизация производительности

  • Аппаратное ускорение. Оптимизируйте модель для определенных аппаратных ускорителей, чтобы повысить скорость и эффективность логического вывода.
  • Квантование. Уменьшите размер модели и требования к вычислениям, преобразовав ее в типы данных с более низкой точностью.
  • Обрезка. Уменьшите размер модели и требования к вычислениям, удалив ненужные веса и нейроны.

Быстрая настройка, Быстрый дизайн, Инструкция по настройке

Важно сравнивать и сопоставлять различные способы настройки или настройки моделей.

Быстрый дизайн. На этом этапе вы разрабатываете начальное приглашение, которое будет использоваться для генерации ответов из вашей языковой модели. Подсказка должна быть тщательно разработана, чтобы вызвать желаемый тип ответа и обеспечить достаточный контекст для модели, чтобы генерировать последовательный и соответствующий результат.

Быстрая настройка. Получив черновик подсказки, вам нужно будет его настроить, чтобы улучшить качество ответов, генерируемых вашей языковой моделью. Это может включать изменение формулировки подсказки, настройку уровня детализации или добавление дополнительного контекста или ограничений для управления выводом модели.

Настройка инструкций. В дополнение к настройке самой подсказки вам также может потребоваться предоставить дополнительные инструкции или рекомендации для модели, чтобы помочь ей генерировать тип вывода, который вы ищете. Это может включать указание определенных критериев для вывода, предоставление образцов вывода для использования в качестве ссылок или установка ограничений на содержимое или стиль сгенерированного текста.

Точная настройка. Когда у вас есть хорошо разработанная подсказка и четкие инструкции для вашей модели, вам нужно будет настроить саму модель, чтобы оптимизировать ее производительность для вашей конкретной задачи. Это включает в себя обучение модели на наборе данных примеров и настройку ее параметров для минимизации функции потерь и улучшения качества сгенерированного текста. Цель тонкой настройки — создать модель, способную последовательно генерировать высококачественные ответы, соответствующие критериям, указанным в подсказке и инструкциях.

Вариант 1: GenAI с первым запросом

Значительно сократите время разработки приложений благодаря оперативному взаимодействию с человеком

Одним из способов продуктивности генеративного ИИ является то, как мы можем использовать его на ранних этапах жизненного цикла разработки программного обеспечения. Благодаря быстрому прототипированию синтетических наборов данных для фрагментов генерации кода мы можем ускорить процесс, используя быстрый дизайн, чтобы ускорить разворот и преодолеть первоначальные барьеры сомнений, чтобы прийти к окончательным путям решения: я буду использовать этот тип данных с этим типом алгоритма. для выполнения этой конкретной задачи.

Таким образом, вы можете думать о жизненном цикле генеративного ИИ, который начинается с быстрой разработки или настройки и сбора данных параллельно или после того, как было определено, что первоначальный прототип осуществим.

Оперативное проектирование и настройка могут быть включены в ранние этапы жизненного цикла GenAI, чтобы оптимизировать производительность и эффективность модели ИИ еще до этапа подготовки данных. Это может помочь обеспечить лучшее соответствие модели ИИ целям проекта, а также предоставить набор более точных и актуальных ответов на последующие входные данные, подсказки и выводы. Соответствующие задачи на этом раннем этапе состоят в следующем.

Когда вы начинаете с быстрой разработки и настройки на ранних этапах жизненного цикла GenAI, вы можете заложить проверенную прочную основу для следующих этапов и задач; даже подготовку данных, сосредоточив внимание на данных, которые вам нужны, и на том, как сгенерированные данные могут быть использованы для руководства подготовкой данных. Также это применимо к этапам обучения, настройки и развертывания модели. Вариация жизненного цикла GenAI на основе подсказок дает нам упреждающий подход к оптимизации подсказок, который может привести к гораздо более эффективному жизненному циклу разработки ИИ и результирующим моделям. Таким образом, мы можем лучше соответствовать желаемым целям и обеспечивать повышенную производительность в конкретных задачах жизненного цикла или в отраслевых областях.

Формулировка проблемы и планирование

Прежде чем приступить к подготовке данных, важно определить проблему, которую вы хотите решить с помощью модели ИИ. На этом этапе вы можете определить конкретные задачи или инструкции, которые должна выполнять модель. Это помогает подготовить почву для разработки соответствующих подсказок и планирования возможных стратегий настройки в дальнейшем.

Предварительные исследования и разведка

На этом этапе вы можете изучить существующие модели и решения ИИ, чтобы понять их сильные и слабые стороны и ограничения. Это может дать вам представление о том, какие стратегии быстрого проектирования или методы настройки могут быть эффективными для вашей конкретной проблемы. Кроме того, вы можете собрать информацию о потенциальных подводных камнях и проблемах, которые, возможно, потребуется решить во время быстрой разработки или настройки.

Разработка и прототипирование подсказок

Вместо того, чтобы ждать этапа подготовки данных, вы можете начать создавать прототипы потенциальных подсказок на ранней стадии процесса. Это позволяет вам экспериментировать с различными формулировками, контекстом и форматированием, чтобы проверить отзывчивость и эффективность модели ИИ. На этом этапе важно повторять и совершенствовать дизайн подсказок, чтобы оптимизировать производительность модели ИИ.

Обратная связь и сотрудничество

Сотрудничество с экспертами в предметной области или целевыми пользователями на ранних этапах жизненного цикла машинного обучения может помочь вам получить представление о конкретных потребностях и требованиях вашей модели ИИ. Эта обратная связь может иметь неоценимое значение для формирования вашего дизайна подсказок или стратегии настройки, а также для обеспечения актуальности и эффективности модели ИИ в предполагаемой области.

Заключение

Искусственный интеллект — это стремительно развивающаяся область, которая может произвести революцию во многих отраслях, способах нашей работы и привести к 10-кратному повышению производительности, но также в 10 раз снизить возможный риск без ответственного ИИ.

Два основных типа ИИ — это генеративный ИИ и прогнозирующий ИИ, которые используются для разных целей. Понимание различий между этими двумя типами ИИ имеет решающее значение для любого, кто работает в этой области.

И генеративный ИИ, и прогнозирующий ИИ могут улучшить нашу жизнь во многих отношениях, но они также могут быть использованы во вредных целях. Поэтому крайне важно внедрить и разработать этические принципы, которые минимизируют проблемы безопасности ИИ, препятствуют злоупотреблению/неправильному использованию моделей ИИ, а также отслеживают и защищают надежность моделей для разработки и использования этих технологий. Поскольку шлюзы внедрения уже открыты, важно продолжать разработку моделей генеративного ИИ и прогнозирующего ИИ, которые будут справедливыми, точными, безопасными и надежными, а также выступать за разработку правил, которые помогут гарантировать, что ИИ используется ответственно.

Вот ключевые дополнения к традиционному жизненному циклу ИИ при внедрении генеративного ИИ:

  1. [Прототипирование на основе подсказок]. В этом варианте начальной фазы, перед подготовкой данных в жизненном цикле GenAI, мы активно фокусируемся на разработке и тестировании подсказок-кандидатов для языковой модели ИИ. Этот метод позволяет экспериментировать с наборами данных, форматами, различными входными формулировками, контекстами и форматами для оценки эффективности модели при решении желаемых задач или целей. Повторение и уточнение подсказок на основе производительности помогает выявить и устранить потенциальные проблемы в понимании и выводе модели. Внедряя прототипирование на основе подсказок на раннем этапе, вы можете лучше согласовать модель ИИ с ее предполагаемой целью, что в конечном итоге приведет к более эффективным стратегиям подготовки данных.
  2. Генерация данных и программная маркировка данных. Помимо сбора и подготовки данных, генеративный ИИ требует использования или создания больших наборов данных для обучения генеративных моделей. Это включает в себя создание синтетических данных или использование методов обучения без учителя для изучения закономерностей из существующих немаркированных данных.
  3. Оперативная, инструктаж и доводка. Это имеет огромное значение для использования моделей и взаимодействия человека с компьютером для повышения эффективности и производительности, используя GenAI в качестве механизма улучшения человека.
  4. Выбор модели: с таким количеством моделей в нескольких модельных садах и центрах, какие открыты для выбора?
  5. Оценка модели. Традиционные методы оценки модели, такие как точность, точность и полнота, могут не подходить для оценки генеративных моделей. Необходимо разработать новые показатели оценки, такие как разнообразие выборки, качество и согласованность.
  6. Интерпретируемость: генеративные модели могут быть трудны для интерпретации, и понимание того, как они генерируют результаты, важно для обеспечения их ответственного использования. Для улучшения интерпретируемости можно использовать такие методы, как визуализация, атрибуция и контрфактический анализ.
  7. Ответственный ИИ и этические соображения. Генеративный ИИ может вызвать этические проблемы, связанные с предвзятостью, справедливостью, конфиденциальностью и безопасностью. Эти опасения необходимо решать путем разработки этических принципов, механизмов прозрачности и подотчетности.
  8. Дистилляция: создание небольших развертываемых моделей для ограничения стоимости и граничных вычислений.
  9. Развертывание: Генеративные модели ИИ могут иметь другие требования к развертыванию, чем традиционные прогностические модели. Для них может потребоваться специализированное оборудование, более длительное время вывода и различные архитектуры развертывания.
  10. Настройка: даже после развертывания развернутая модель настраивается для структурирования желаемых типов ответов.
  11. Мониторинг: генеративные модели могут генерировать неожиданные результаты с течением времени, и мониторинг их производительности имеет решающее значение для обеспечения их постоянной надежности и безопасности. Такие методы, как обнаружение дрейфа и контуры обратной связи, можно использовать для мониторинга и улучшения производительности модели.

Рекомендации

[1] Моделирование методов учитель-ученик в глубоких нейронных сетях для дистилляции знаний, Саджад Аббаси, Мохсен Хаджабдоллахи, Надер Карими, Шадрох Самави. https://arxiv.org/abs/1912.13179

[2] Ученик стал мастером: дистилляция встраивания слов на основе модели учитель-ученик с ансамблевым обучением, Bonggun Shin, Hao Yang, Jinho D. Choi. https://www.ijcai.org/proceedings/2019/0477.pdf

[3] Языковые модели — это учащиеся с небольшим количеством попыток, Браун, Т. Б., Манн, Б., Райдер, Н., Суббиа, М., Каплан, Дж., Дхаривал, П., … и Амодей, Д. (2020). Препринт arXiv arXiv: 2005.14165.