Компания: Хартекс

Основатели: Михаил Малюк, Николай Любимов и Макс Ткаченко

Инвесторы: Сатиш Дхармарадж и Джордан Сегалл

Утечка мозгов. Внедрение искусственного интеллекта (ИИ) и машинного обучения (МО) в компаниях идет по крутому склону. Согласно опросу 2021 года, 67% предприятий планируют ускорить свою стратегию ИИ с целью создания более эффективных бизнес-процессов, создания новых бизнес-моделей и прокладки пути для дополнительных потоков доходов.

Подготовка данных — это одна из областей, где начинается поистине героическая работа при масштабном создании моделей AI/ML. То, насколько умен ИИ, зависит от качества модели, которая, в свою очередь, зависит от данных, используемых для ее обучения и эксплуатации. Команды специалистов по данным должны сначала организовать огромные объемы неструктурированных данных, используя маркировку данных и аннотации, чтобы превратить их в структурированные данные, которые затем используются для обучения модели AI/ML. Это важный шаг, который определяет способность модели понимать новую информацию и делать прогнозы. Если маркировка и аннотирование данных не выполнены должным образом, модели AI/ML будут неточными, что затруднит получение отдачи от инвестиций.

Эврика!: Будучи инженерами-программистами, Михаил Малюк, Николай Любимов и Макс Ткаченко слишком хорошо знали болевые точки структурирования и маркировки данных. Их опыт в процессе разработки AI/ML привел их к разработке Label Studio, платформы с открытым исходным кодом, которая поддерживает маркировку и аннотирование данных. Label Studio применима для широкого спектра вариантов использования ИИ, включая обработку естественного языка (NLP), компьютерное зрение (CV), аудио, временные ряды, многодоменность и многое другое.

По мере того, как все больше компаний интегрируют сложные модели AI/ML в свой бизнес, они ощущают влияние тонкой маркировки данных на свои результаты. Многие компании начали с аутсорсинга маркировки данных сторонним поставщикам услуг; однако этим маркировщикам данных часто не хватает уникальной отраслевой терминологии и опыта (вспомните 401k или медицинские термины, а также разные языки), чтобы генерировать высокоточные размеченные данные, чтобы привести к дифференцированным и конкурентоспособным моделям. Кроме того, аутсорсинговая маркировка данных требовала от компаний отправки конфиденциальных данных маркировщикам, которые часто не имеют глубоких контекстуальных знаний о проектах. В результате компании начали создавать собственные команды по маркировке данных с экспертами в предметной области, но им исторически не хватало настраиваемого, масштабируемого решения, которое упрощает и организует маркировку в любом масштабе. Heartex позволяет компаниям повысить эффективность своих внутренних команд и избежать отправки своих данных для маркировки за пределы организации.

Столкнувшись с огромным спросом, Малюк, Любимов и Ткаченко основали Heartex, компанию, стоящую за Label Studio, призванную помочь предприятиям интегрировать программное обеспечение, процессы и аннотаторы данных, чтобы улучшить структуру и маркировку своих данных для технологий AI/ML.

На сегодняшний день этим программным обеспечением воспользовались более 100 000 пользователей, и оно стало крупнейшим и самым популярным сообществом в своем роде, в котором участвуют около 5 000 специалистов по искусственному интеллекту, машинному обучению и науке о данных, ориентированных на данные, по всему миру в канале Slack.

Умный ход: творение этих специалистов по данным и инженеров-программистов быстро привлекло внимание инвесторов, и сегодня Heartex празднует закрытие серии A стоимостью 25 миллионов долларов под руководством Redpoint Venture, в результате чего общая сумма, привлеченная компанией, составила 30 миллионов долларов. В раунде также приняли участие Unusual Ventures, Bow Capital, Swift Ventures и многие известные инвесторы-ангелы. Наш управляющий директор Сатиш Дхармарадж рад присоединиться к совету директоров Heartex.

Вклад инвесторов:если вы уменьшите масштаб, чтобы посмотреть на более широкую хронологию развития корпоративных технологий, обнаружите, что интеграция ИИ/МО в бизнес-стратегию является относительно новой, поэтому мы только сейчас видим смежные технологии, такие как Heartex, подойти к столу. И это не могло прийти достаточно скоро. Ему всего три года, и это говорит о многом: Heartex уже был назван ведущим программным обеспечением для маркировки данных наряду с такими отраслевыми приверженцами, как AWS. Поскольку это единственное комплексное решение для управления внутренними продуктами для маркировки данных, мы рады видеть, что это позволит компаниям делать в течение следующих нескольких лет.

Мы в восторге от того, что будет!