Практический искусственный интеллект в бизнесе

Бизнес может эффективно использовать ИИ, понимая, как это делается.

Искусственный интеллект в бизнесе практичен. Когда вы думаете о нейронных сетях, не думайте об абстрактных математических структурах, а о компьютерных системах, которым нужны данные для изучения бизнес-процессов и того, как работать с ними.

Наука о данных и практический ИИ в бизнесе

Наука о данных - это не настоящая наука, это область экспериментов, где вам нужно постоянно настраивать, тестировать, создавать прототипы с нуля и перестраивать то, что у вас есть. Это структура для решения проблем, а не конкретный набор инструментов. Эта парадигма использования нейронных сетей, статистики по стероидам - это то, что делает ИИ как практически, так и теоретически сложным с таким широким спектром приложений, о котором мы поговорим в следующей главе.

Итак, как сейчас делается наука о данных или искусственный интеллект? Вы можете разделить реальную работу на две части, тесно связанные друг с другом:

реализация
исследовательская работа

Этап внедрения ориентирован на практическое решение конкретной бизнес-проблемы. Используя данные внутри вашей организации, специалисты по анализу данных внедряют модели машинного обучения, чтобы изучать эти данные. На этом этапе большое внимание уделяется инженерным аспектам науки о данных:

данные очистки
извлечение признаков
статистический анализ
обучение нейронных сетей
настройка виртуальных машин и общего окружения.

Фаза исследования - это поиск возможных настроек, улучшений или совершенно новых подходов к уже существующим. Это может быть чтение научных статей, официальных документов других организаций, просмотр открытого исходного кода на Github, общение с другими инженерами по машинному обучению, посещение конференций. Цель состоит в том, чтобы расширить кругозор и найти новые стратегии для реализации.

Как правило, невозможно, что будет первым, внедрение или исследование, поскольку на первых этапах специалисты по обработке данных часто строят самую первую наивную модель, видят, как она работает с заданными данными, а затем ищут другие подходы и улучшения. Для более сложных и увлекательных проектов инженеры по машинному обучению могут начать с исследования, прочитать все, что можно найти по теме в Интернете, и только затем выбрать пару моделей для реализации и опробования.

Тем не менее, большую часть времени специалисты по данным проводят перед компьютером, будь то чтение, написание кода или обучение моделей машинного обучения. В корпорациях часто неправильно понимают, что обычные спринты, выполняемые при классической разработке программного обеспечения (метод бережливого запуска), не всегда полезны для поиска решений более сложных проблем, требующих глубокого мышления. Вот почему правило Google 20%, разрешающее 20% свободного времени для работы над собственными проектами разработчиков программного обеспечения, так плодотворно. Специалистам по данным нужно возиться и экспериментировать с идеями, чтобы развивать свои творческие способности.

Исследования в области искусственного интеллекта

Исследовательское сообщество в области искусственного интеллекта можно разделить на три подразделения:

сообщество машинного обучения
этика и социальное сообщество
бизнес-сообщество

Сообщество машинного обучения в первую очередь занимается вопросами исследования, связанными с построением моделей машинного обучения: от архитектуры и данных до реализаций. Для активного участия необходим кандидат компьютерных наук или STEM.

Этика и социальное сообщество фокусируются на социальных разветвлениях проведения исследований ИИ и их применения на практике: от законодательства до важных вопросов или ограничений в отношении того, что должно быть целью исследований ИИ. Люди в этом сообществе часто работают в социальных отделах университетов, аналитических центрах или государственных учреждениях.

Бизнес-сообщество сосредоточено на применении передовых исследований к бизнес-проблемам. К ним могут относиться производство, разработка лекарств, кибербезопасность, видеоигры и другие. Исследователи здесь работают в основном в исследовательских лабораториях крупных организаций. Кандидат наук не является необходимым, но часто является дополнительным преимуществом, когда дело доходит до поиска работы в них.

Исследовательская карьера в области искусственного интеллекта

Если кто-то хочет стать исследователем в области искусственного интеллекта, стандартный путь - через университет, получение докторской степени в области компьютерных наук, а затем получение должности доцента или научного сотрудника. Благодаря недавним изменениям в том, как работают исследования, например, как Amazon, Facebook, Google и аналогичные крупные технологические компании участвуют в проведении исследований, часто случается, что только что новые кандидаты наук обращаются напрямую к одному из технических гигантов, работающих в их исследовательских лабораториях. Также возможно, что они одновременно получают докторскую степень и работают в одной из тех компаний, которые выгодны для каждой стороны: компания спонсирует докторскую степень, университет освобождается от расходов, аспирант имеет работу и занимается чем-то важным для отрасли.

Сама докторская диссертация - это монография, в которой обсуждается и решается открытая проблема или некоторый ее случай, с использованием новых методов в уже установленной проблеме или изобретением новых проблем, связанных с существующими знаниями. Есть темы, которые в определенное время более модны, чем другие, и это связано с интересами конкретных профессоров или интересами рынка (где есть деньги). Часто во время получения докторской степени студент публикует несколько статей, которые затем составляют основную часть докторской степени.

С точки зрения аспиранта, самое важное - найти хорошего консультанта с доступом к интересным проблемам, фондам и исследовательским группам. Интересные задачи позволят ему провести значимое исследование, средства позволят ему ездить на конференции и тратить много средств на инфраструктуру, исследовательская группа будет неоценимой для исследовательских дискуссий.

Посещение конференций - отличный способ общаться с коллегами-учеными. Самая популярная и престижная конференция по машинному обучению - это ежегодное собрание NIPS, Neural Information Processing Systems. Число ученых, подающих заявки на участие в NIPS, растет на 30% каждый год, что также показывает, насколько активно сейчас сообщество машинного обучения.

Привлечение талантов ИИ в бизнес

С точки зрения бизнеса, который конкурирует с академическим сообществом за таланты, решающим аспектом является создание динамичной среды для проведения исследований. Выделение свободного времени для проведения любых исследований - хорошее решение, но решающее значение имеет создание исследовательской группы вокруг высокопоставленного лица. в поле. Часто крупные организации нанимали профессора из отдела машинного обучения вместе с его аспирантами, чтобы быстро создать исследовательское сообщество. Например, это то, что Uber сделал с переманиванием людей из отдела робототехники Карнеги-Меллона.

Большая проблема для таких авторитетных организаций, как банки или страховые компании, заключается в том, чтобы представить себя привлекательным способом для потенциальных сотрудников, занимающихся машинным обучением. Решающее значение здесь имеет понимание того, что привлекательность для исследователей - это способность вводить новшества, свобода мысли, атмосфера открытости и наличие сложных проблем, которые нужно решать. Никто не хочет постоянно зацикливаться на линейной регрессии. Для привлечения талантов часто лучше ставить слишком сложные задачи, чем слишком простые.

Хороший пример того, что может быть хорошей проблемой, можно увидеть на Kaggle (www.kaggle.com), где компании решают задачи по науке о данных для решения своих бизнес-задач, устанавливая приз за лучшие работы. Часто в этих соревнованиях принимают участие тысячи команд. Одним из самых известных стал конкурс, организованный Netflix по совершенствованию своих рекомендательных алгоритмов. Объявив приз в 1 миллион долларов, конкурс привлек большую аудиторию, поставил Netflix на карту великих технологических компаний, над которыми можно работать, и дал Netflix множество новых исследовательских материалов, имеющих отношение к их бизнес-деятельности.

Сообщество открытого исходного кода

Важным с точки зрения бизнеса и все еще недостаточно используемым бизнесом, является сообщество разработчиков ПО с открытым исходным кодом в рамках машинного обучения. Большая часть исследований доступна бесплатно на GitHub, репозитории кода, и может быть собрана и использована совместно с другими частями для создания чего-то уникального, что вам нужно. Никогда еще создание прототипа не было таким быстрым и дешевым, как сейчас. Сообщество с открытым исходным кодом также является отличным источником для потенциальных сотрудников, поскольку оно точно показывает, на что способен данный человек.

С точки зрения бизнеса поддержка сообщества разработчиков ПО с открытым исходным кодом имеет много преимуществ: доступ к кадрам, постоянная информация о текущих исследованиях. Более того, это может принести деловые контакты. Вспомните модель Red Hat, которая отвечала за поддержку Linux, а затем зарабатывание денег с помощью поддержки и настроек. В конце концов, Red Hat была приобретена IBM в рамках одного из крупнейших технологических приобретений на сегодняшний день за 34 миллиарда долларов, закрытого в 2019 году.

Сам GitHub был приобретен Microsoft в 2018 году за 7,5 миллиардов долларов, а Kaggle был приобретен Google в 2017 году. Это не только показывает, насколько важно сообщество разработчиков ПО с открытым исходным кодом для бизнеса, но и показывает, что на самом деле вы можете сделать бизнес, используя усилия с открытым исходным кодом, если вы иметь возможность создать отличный продукт и создать вокруг него сообщество заинтересованных пользователей.

От исследований к приложениям

Обсудив, как проводятся исследования в области ИИ, пришло время сосредоточиться на приложениях. Предполагая, что у вас уже есть группа по анализу данных и предварительное исследование проблемы, которую вы хотите решить, выполнено, следующим шагом будет сбор и очистка данных. Этот процесс может быть коротким, если большая часть вашего бизнеса ведется в цифровом формате с легким доступом к данным, или долгим и болезненным, если у вас много источников, на которые нужно смотреть, а данные далеко не чистые (например, опросы клиентов, проводимые в различных форматах). В таком случае предварительная обработка - это сама задача, для выполнения которой потребуется отдельная команда. Это особенно важно для всех последующих работ, поэтому не игнорируйте данные очистки.

Применение исследований к бизнес-приложениям означает использование моделей машинного обучения на данных, поступающих от вашего бизнеса, и измерение того, насколько хорошо они ведут себя по сравнению с тем, как вы обычно решаете проблему (например, время, потраченное на бизнес-процесс, маркетинг / продажи, количество релевантных потенциальных клиентов) . После получения данных ваша команда инженеров по машинному обучению установит показатели для измерения прогресса и начнет внедрять (кодировать) алгоритмы машинного обучения, заполняя их данными, которые вы предоставили. Конечным результатом будет либо показатель точности прогнозов, автоматизированный бизнес-процесс или оптимизированные вычисления.

На этапе реализации критически важно иметь хорошие показатели для сравнения моделей (архитектуры), машин (инфраструктуры) и данных, используемых при обучении и оценке. Понимание того, почему результаты такие, каковы они есть, не менее важно, чем получение модель, дающая наилучшие результаты.

Масштабирование решения для большего количества данных и использование моделей в производстве часто требует больше инженерных знаний, чем талантов машинного обучения, и, следовательно, требует найма другого кадрового резерва, чем на этапе исследования. Однако, поскольку реализация и исследования тесно связаны, лучшее - это тесная совместная работа исследователей и инженеров.

Подводя итог, можно сказать, что практический ИИ в бизнесе осуществляется через цикл:

исследование возможных моделей машинного обучения
сбор данных
использование моделей для сбора данных
улучшение инфраструктуры, данных и масштабирования

После шага 4 мы снова переходим к шагу 1, получая отзывы о том, как модели работают на практике и что можно улучшить, исследователи могут искать новые алгоритмы и методы для решения возникшей проблемы. Весь цикл повторяется до тех пор, пока показатели, определенные в начале процесса, не будут удовлетворены. Вот почему важно с самого начала создать основу для экспериментов с машинным обучением, даже если они будут меняться позже, с новыми экспериментами.

Этот текст - отрывок из моей будущей книги Бизнес в области искусственного интеллекта. Моя предыдущая книга была посвящена поиску работы в области науки о данных.