Готовы ли ваши данные для ИИ?

Компании торопятся представить любое решение, обещающее искусственный интеллект и машинное обучение. Но поспешное внедрение оставляет без ответа один важный вопрос: готовы ли ваши данные к этой новой революции, управляемой машинами?

Для большинства компаний ответ - нет.

Лидеры отрасли в каждом секторе стремятся внедрить сложные системы, обещающие внедрение ИИ и машинного обучения в их организации. Руководителям часто нравится концепция технологии, которая даст им возможность видеть то, чего не могут видеть люди, вносить предложения или изменения в бизнес, которые могут открыть новые возможности и значительно повысить эффективность.

Хотя возможности определенно есть, а в некоторых случаях и технология, существует серьезное несоответствие между возможностями, которые представляют искусственный интеллект и машинное обучение, по сравнению с оперативной готовностью сред данных большинства организаций.

«AI похож на секс в старшей школе. Все говорят, что делают это, на самом деле очень немногие делают это, а те, кто делают, делают это неправильно ».

В ходе наших обсуждений с лицами, принимающими решения, во многих ведущих компаниях в различных секторах (финансы, страхование, недвижимость и т. Д.) Мы наблюдаем довольно твердое понимание хранилищ данных в сочетании с очень пенистым желанием создать богатый прикладной уровень. которые могут начать решать свои бизнес-задачи.

Однако в действительности хранилище данных и уровень приложения представляют собой начало и конец процесса, и то, что обычно отсутствует в середине этого процесса, - это довольно сложный стек, который преобразует необработанные данные на одном конце в полезную информацию на другой. Проблема не только в том, что этот промежуточный слой трудно решить, но и в том, что многие лица, принимающие решения, устанавливают ИТ-стратегию, бюджет и сроки, неизвестно.

«Если Watson может победить в Jeopardy, он должен обладать когнитивными способностями, чтобы перебирать мои данные и развивать понимание, верно?»

Часто у организаций есть стратегия хранилища данных или полностью развернутое решение хранилища данных, которое нацелено на сбор данных в одном месте. К этой стратегии обычно прилагается подробный список уже приобретенных приложений или дорожных карт решений с использованием новых технологий (ИИ, машинное обучение, автоматизация, аналитика, визуализация). На высоком уровне казалось бы, что проблема решена:

Соберите все данные вместе - Проверьте.

Покупайте приложения, которые превращают необработанные данные в аналитическую информацию - Проверить.

Идея здесь в том, что как только мы собрали все данные в одном месте, мы можем подключить их ко всему, что захотим. Простой. Проблема в том, что данные, поступающие из хранилища (ов), не имеют общего стандарта, и приложения, расположенные поверх данных, не могут быть полностью реализованы, потому что ...

... между данными (озеро или без озера) и корпоративными приложениями, которые еще не определены или не реализованы, находится огромный слой уточнения. Чтобы решить эту проблему, необходимо внедрить систему, способную преобразовывать данные со своего родного языка в централизованный стандарт, который может понять любое приложение. Более того, он должен иметь возможность делать это на постоянной основе и продвигаться вперед, а также иметь возможность масштабироваться до бесконечного числа новых и существующих источников данных.

Даже самое лучшее программное обеспечение требует хороших данных.

В конце концов, любое приложение, автоматизация или технология AI / ML должны подкрепляться уточненными, стандартизованными данными, чтобы работать с максимальной отдачей. Без стандартных данных технология, меняющая правила игры, которую вы хотите внедрить, которая обещает произвести революцию в вашем бизнесе, будет ограничена наименьшим общим знаменателем стандартных данных, к которым она может получить доступ. Обычно это означает чрезвычайно ограниченный объем информации, даже если теперь вся информация поступает из одного и того же места.

Данные необходимо преобразовать в топливо и доставить в необходимых количествах приложениям, которые они должны обеспечивать. Система, которая выполняет это, или, еще лучше, процесс уточнения данных, который проверяет все необходимые поля, выглядит так:

Или для тех, кто интересуется тем, что мы делаем для некоторых наших клиентов с помощью нашей платформы Namara, это выглядит так:

Многие действительно успешные демонстрации технологий AI и ML запускаются на основе чрезвычайно чистых и стандартизированных библиотек данных. Но в большинстве организаций данные по-прежнему довольно разделены. Объединение данных в «озеро» или в корпоративное облако позволяет собрать данные в одном месте, но часто по-прежнему отсутствует стандартизация самих данных. Этот уровень стандартизации данных по-прежнему является огромным препятствием, которое многие организации еще не преодолели. И сложность проблемы только усугубляется добавлением новых внешних источников данных, которые дальновидные организации начинают ценить и использовать.

Разнообразие данных означает множество проблем.

Проблема, которую мы пытаемся решить, заключается в разнообразии данных. Правильное хранение помогает нам решать проблемы с объемом и скоростью, но мир с полностью разблокированными корпоративными приложениями требует от нас ответа на вопрос о том, как мы последовательно преобразуем аналогичные данные, поступающие из разных мест, в общий стандарт.

Во многих организациях ответ таков: «Это работа наших специалистов по обработке данных». Но если мы действительно об этом задумаемся, так должно ли быть? Специалисты по обработке данных - это высококвалифицированные, хорошо оплачиваемые люди, время и силы которых должны быть сосредоточены на том, чтобы помочь бизнесу расти на основе данных. Если это так, то почему так много времени они уделяют поиску, очистке, стандартизации и мониторингу данных? Короткий ответ заключается в том, что так должно быть, поскольку у большинства организаций нет нужного конвейера обработки данных для генерации идеальных данных таким образом, чтобы их приложения и их ученые работали максимально эффективно.

Это превращает большинство специалистов по обработке данных в уборщиков данных, а также является причиной того, что большинство корпоративных приложений никогда не будут полностью развернуты на предприятии.

«Проблема не в отсутствии направления или способностей. Это отсутствие точных данных ".

Идея озера данных или облака - хорошая и необходимая концепция. Данные должны быть объединены в группы, чтобы к ним могли получить доступ несколько функций по разным причинам. Многие хорошие вещи стали возможны, потому что люди начали осознавать пользу знания того, где находятся их данные и из чего они на самом деле сделаны. Теперь, когда мы смотрим на следующую фазу бизнес-аналитики, которая включает в себя автоматизацию, искусственный интеллект и машинное обучение, мы должны меньше думать о данных, хранящихся в озере, и больше о том, как эти данные должны передаваться по всей организации в стандартный способ. Мы выходим за рамки необходимости в контейнере, который может хранить наши данные, и мы движемся к необходимости сосудистой системы, которая могла бы передавать данные туда, где они должны быть, в требуемой форме и форме.

Это может показаться огромным шагом вперед, но на самом деле это вполне достижимо. Фактически, многие из необходимых элементов представлены на приведенных выше рисунках. Само по себе это непростая задача, но ее необходимо решить, если вы действительно думаете с точки зрения предприятия.

Вывод здесь - не переставать смотреть на новые технологии, которые могут помочь раскрыть огромный потенциал. Следует помнить, что, какими бы блестящими и удивительными ни были новые решения, все они требуют ракетного топлива, чтобы взлететь. Когда мы говорим о корпоративных приложениях, которые меняют правила игры, в качестве ракетного топлива используются стандартизованные данные. И процесс его усовершенствования необходимо внедрять параллельно с внедрением новых инструментов и приложений Business Intelligence.

Зайдите в Намара, чтобы узнать больше.

Готовы ли ваши данные для ИИ?

Для большинства компаний ответ - нет.

Даже самое лучшее программное обеспечение требует хороших данных.

Разнообразие данных означает множество проблем.

Похожие вопросы