Машинное обучение

За последнее десятилетие машинное обучение (МО) и искусственный интеллект (ИИ) доминировали в сфере информационных технологий до такой степени, что большинство предприятия используют решения на основе машинного обучения. Вот несколько примеров, которые могут быть вам знакомы:

  • Виртуальные помощники, такие как Siri или Alexa, используют машинное обучение для анализа речевых паттернов.
  • Предлагаемые Google и Tesla самоуправляемые автомобили — суть ML, изучающая и воспроизводящая поведение человека-водителя.
  • Приложения для перевода созданы на основе машинного обучения и создания лингвистических правил.
  • Онлайн-рекомендации от таких компаний, как Amazon и Netflix, основаны на (ужасно точном) онлайн-профиле вашего поведения, созданном с помощью алгоритмов машинного обучения.

Машинное обучение фокусируется на использовании данных и алгоритмов, чтобы имитировать способ обучения людей, постепенно повышая его точность. Эти алгоритмы строят модель на основе выборочных данных (известных как обучающие наборы), чтобы делать прогнозы или принимать решения без явного программирования для этого. Мы можем представить себе алгоритм машинного обучения, подобный человеческому младенцу, который, используя образцы данных слов, которые он слышит, создает модель языка, которую можно использовать для создания новых предложений.

С появлением и ростом мощности квантовых компьютеров технологии готовятся к следующему большому перевороту. Но остается вопрос: как лучше всего использовать наши новые квантовые компьютеры для улучшения существующих алгоритмов машинного обучения или даже для разработки совершенно новых.

Если вам нужно краткое изложение того, как работают квантовые компьютеры и их преимущества, вы можете прочитать эту статью, где мы даем вам основы.

Квантовое Машинное обучение

Было проведено огромное количество исследований по этому вопросу. Только в октябре 2022 года в физическом архиве было более 50 статей, в которых в аннотации упоминалось «квантовое машинное обучение».

Этот энтузиазм уместен. Улучшение машинного обучения за счет более быстрого структурированного прогнозирования указано как (один из) первых прорывов в области квантовых вычислений, сделанных крупными консалтинговыми фирмами, такими как McKinsey & Company.

Есть две основные причины, почему машинное обучение и квантовые компьютеры подходят друг другу:

  1. Более низкие требования к точности и частоте ошибок по сравнению с другими приложениями для квантовых компьютеров. Устройства квантовых вычислений по своей природе уязвимы для шума и потери информации, особенно в эпоху NISQ*. Когда дело доходит до алгоритмов машинного обучения, мы много раз запускаем небольшие схемы, уменьшая влияние ошибок на наши результаты. Как и в классическом машинном обучении, у нас есть переменные элементы, которые могут многократно изменять нашу схему в течениево время выполнения алгоритма. Это позволяет схеме адаптироваться и преодолевать ошибки по мере их появления.
  2. Машинное обучение представляет данные в многомерных пространствах параметров. Квантовые схемы имеют экспоненциальное преимущество в плане размерности**. Одним из основных преимуществ квантовых компьютеров является их способность эффективно кодировать информацию. Это может значительно уменьшить размер необходимых данных для алгоритма ML.

Когда мы используем методы ML с квантовыми процессорами (QPU), мы вступаем в новую область исследований, называемую квантовым машинным обучением (QML).

Почему фотоника?

Фотонные квантовые компьютеры быстро зарекомендовали себя как доминирующие архитектуры не только для краткосрочных квантовых приложений, но и для полномасштабных отказоустойчивых квантовых компьютеров. Помимо своих преимуществ для квантовой связи, масштабируемости и безопасности, фотонные QPU также предлагают некоторые уникальные преимущества для встраивания данных, которые имеют ощутимые преимущества для приложений QML.

Описание работы вычислений на оптическом квантовом компьютере вы можете найти здесь!

Процесс встраивания данных — одно из узких мест квантового машинного обучения. Действительно, классические данные нельзя загрузить как есть в квантовый чип — их нужно каким-то образом закодировать в квантовое состояние. Если процесс кодирования слишком затратный, он потенциально может замедлить общие вычисления настолько, что сведет на нет любое квантовое ускорение. Учитывая это, необходимы более эффективные стратегии кодирования данных.

Фотонные квантовые компьютеры обладают уникальным преимуществом: они могут хранить информацию в более эффективном пространстве, чем другие аппаратные средства. Пространство — это очень общее математическое понятие, которое в данном случае просто относится к структуре наших данных. Вы можете представить наши квантовые состояния как живущие в определенном пространстве.

С фотонными устройствами мы можем хранить нашу информацию в пространстве Фока вместо гильбертова пространства, используемого для других квантовых процессоров.

На приведенной ниже диаграмме показана разница между хранением информации в гильбертовом пространстве и в пространстве Фока. В гильбертовом пространстве каждый кубит представлен в виде собственной моды, вы можете представить моды как дома, в которых живут данные. Это означает, что каждый кубит живет в своей собственной матрице в гильбертовом пространстве. В то время как в пространстве Фока это гораздо более общая установка, где фотоны могут жить вместе, и мы можем подсчитать количество неразличимых частиц в каждой моде.

На этой диаграмме мы можем видеть гильбертово и фоковское представление одного и того же состояния. В гильбертовом пространстве есть мода для каждой частицы, но пространство Фокасчитает частицы в каждой моде, оно находится в состоянии |2,2›, что означает, что у нас есть два фотонов в первой моде и двух во второй.

В гильбертовом пространстве каждый дополнительный фотон удваивает наши возможные комбинации, что приводит к масштабированию 2𝑛, где n — количество фотонов. Это следует из того факта, что в нашем описании кубитов в гильбертовом пространстве мы рассматриваем каждый кубит как двухуровневую систему, то есть каждый кубит добавляет 2 новые степени свободы.

Ограничивающий аспект кубитного представления квантовых данных в гильбертовом пространстве заключается в том, что полезно моделировать наши кубиты только как двухуровневую систему, несмотря на количество доступных режимов.

В пространстве Фока наши доступные комбинации масштабируются с помощью биномиального коэффициента:

n — количество фотонов, а m — количество мод.

Может быть не сразу понятно, почему это так, поэтому давайте рассмотрим ситуацию, когда у нас есть 4 фотона и 3 моды, чтобы распределить их между ними в пространстве Фока:

Итак, в этом случае (n = 4, m = 3) у нас есть 4 фотона, которые нужно распределить по 3 модам. Эта проблема теперь имеет форму знаменитой теоремы о звездах и решетках.

Мы можем представить, что у нас есть 4 неразличимых шара, которые нужно поместить в 3 корзины, и мы должны посчитать все возможные комбинации. Если мы посчитаем возможности, мы получим

Теорема о звездах и полосах утверждает, что это отношение всегда масштабируется как биномиальный коэффициент. Однако в экспериментальной реальности не всегда возможно получить доступ ко всем состояниям в пространстве Фока. Это потому, что мы не всегда можем измерить несколько фотонов в одной моде с идеальной точностью. Это активная область исследований.

Это преимущество масштабирования для кодирования наших данных в фотонное пространство Фока показано для случаев, когда количество мод вдвое превышает количество фотонов (m = 2n), на следующем графике:

Таким образом, фотонные устройства позволяют нам получить доступ к пространству Фока, которое имеет очень полезное масштабирование вычислительного пространства. Мы должны воспользоваться этим при разработке алгоритмов для работы на фотонных квантовых компьютерах.

Универсальный аппроксиматор функций (ряд Фурье)

Чрезвычайно полезное применение фотонной квантовой схемы, устроенной таким образом, заключается в том, что ее можно использовать для моделирования рядов Фурье.

Ряд Фурье — это разложение математической функции по бесконечной сумме функций синуса и косинуса.

Для нематематиков в аудитории это может показаться не особенно захватывающим приложением, но те, кто потрудился над модулем многомерного анализа, знают, что эти ряды Фурьеможно использовать для аппроксимации ЛЮБЫХ функция, определенная на заданном интервале с произвольной степенью точности.

Это означает; если мы сможем показать, что любой ряд Фурье может быть сгенерирован квантовой схемой, то мы создали универсальный генератор функций.

Ряд Фурье имеет вид:

где x — наши точки данных, — переменные коэффициенты, а ω — целые числа, кратные базовой частоте ω0. Ω — наш диапазон частот.

В этой статье они подробно обсуждают условия, необходимые для того, чтобы квантовая схема универсально выражала ряд Фурье.

Подводя итог: чем больше фотонов мы отправляем, тем более выразительной становится операция кодирования данных и тем больше становится доступный спектр выходной функции.

Описание схемы
Наши квантовые схемы немного похожи на классическую нейронную сеть. В традиционной нейронной сети у вас есть узлы или нейроны, связанные весами, и вы пытаетесь оптимизировать эти веса, чтобы минимизировать функцию стоимости.

В ML функции стоимости используются для оценки того, насколько плохо работают модели. Проще говоря, функция стоимости — это мера того, насколько неверна модель с точки зрения ее способности оценивать взаимосвязь между входными данными функции и ее выходными данными. Таким образом, чем меньше значение функции стоимости, тем лучше наша модель.

В традиционном машинном обучении мы вводим точки данных в обучаемые блоки схемы, которые имеют настраиваемый параметр, который мы можем настроить в ходе нескольких запусков нашей схемы, чтобы минимизировать заданную нами функцию стоимости.

Пока что так классически.

Что уникально в наших схемах QML, так это то, что наши данные передаются в квантовую схему, которая кодирует наши данные в квантовое состояние (например, наше состояние Фока), которое затем обрабатывается настраиваемыми квантовыми вентилями. Параметры θ для этих квантовых вентилей оптимизируются с использованием классического алгоритма и возвращаются обратно в квантовую схему, чтобы дать нам идеальный квантовый выход. Это показано на диаграмме ниже:

Мы можем видеть, что параметры наших квантовых вентилей изменены, чтобы дать нам желаемый результат. Мы называем его гибридным алгоритмом, поскольку он использует как классические, так и квантовые методы.

Алгоритм классификатора

Все, что мы обсуждали до сих пор, можно аккуратно реализовать в QML — алгоритм классификатора.

Алгоритм классификатора используется для обучения схемы распознаванию и различению различных категорий данных. Мы рассмотрим алгоритм двумерного двоичного классификатора, который является простейшим примером, поскольку он различает только две категории данных.

Для алгоритма бинарного классификатора цель проста. У нас есть набор данных с элементами, принадлежащими к одному из двух классов, классу A или классу B. Мы должны обучить алгоритм, чтобы различать разницу.

Наш алгоритм основан на следующей схеме:

Ввод и вывод данных

Как и в типичном алгоритме машинного обучения, мы сначала вводим данные для обучения. Это кодируется блоками S(x) в наши состояния Фока:

где n — количество фотонов, отправленных в моду i. Эти данные обрабатываются нашими обучающими блоками W(θ) и выводятся в виде ряда Фурье f(xi), как обсуждалось ранее. .

Функция стоимости

Затем нам нужно определить и минимизировать функцию стоимости для обучения нашей схемы с помощью этих обучающих данных. Наша цель состоит в том, чтобы, когда мы даем обученной схеме новые тестовые данные, она могла классифицировать и разделять их.

Тестовые данные имеют предопределенную классификацию Yxi, которая определяет класс, к которому они принадлежат. Итак, наша функция затрат примет вид:

Это разница между значениями f (классификация, предсказываемая нашей схемой) и y (фактическая классификация данных). Путем настройки параметров θ блоков W(θ) наша схема может быть обучена идеально идентифицировать обучающие данные, максимально минимизируя эту функцию стоимости.

Адаптировав схему, чтобы свести эту функцию стоимости к минимуму, мы подготовили схему, которая может выводить правильную классификацию данного входа.

После этого наша схема готова классифицировать некоторые новые тестовые данные. На рисунке ниже мы видим иллюстрацию того, как данные могут быть классифицированы и разделены.

Это самая простая версия алгоритма такого типа, но она дает представление о том, что возможно. Эти алгоритмы уже применяются в таких приложениях, как классификация различных молекул. Это может быть очень полезным для открытия новых химических продуктов, таких как лекарства.

Скептицизм QML

Ради баланса стоит отметить, что наряду с большим энтузиазмом в отношении QML-методов существует некоторый (действительный) скептицизм в отношении шумихи вокруг этой темы.

Мария Шульд и Натан Киллоран обрисовывают ряд критических замечаний нашего нынешнего отношения к этой области. Они напоминают исследователям избегать туннельного видения квантового преимущества.

Это проницательный момент, что многие люди спешат реализовать квантовые версии классических алгоритмов, даже если квантовая версия может быть не особенно полезной. Затем они могут попытаться повысить производительность с помощью квантового алгоритма и заявить о квантовом преимуществе. Иногда такое повышение производительности достигается только для тщательно отобранного конкретного набора данных, или классический аналог мог бы работать лучше, если бы он был оптимизирован больше.

Точно так же, как не ожидается, что квантовые компьютеры будут лучше классических компьютеров для всех задач, а только для некоторых конкретных (таких как факторизация с помощью алгоритма Шора), мы ожидаем, что QML превзойдет ML только в конкретных задачах. сценарии. Теперь задача исследователей — найти сценарии, в которых QML действительно преуспеет.

*NISQ (Noisy Intermediate Scale Quantum) относится к современной эре квантовых технологий, когда мы работаем с ограниченным числом кубитов, на которые влияет шум/помехи.

**Это квантовое преимущество размерности не гарантируется, но может быть полезным, если встраивание данных выбрано тщательно. Это зависит от решения проблемы ввода-вывода. Это обсуждается в следующем разделе и более подробно здесь.

Если вам интересно узнать больше о наших технологиях, наших решениях или вакансиях, посетите qudela.com.