Еженедельный информационный бюллетень с более чем 100 000 подписчиков, в котором обсуждаются важные исследовательские работы по машинному обучению, интересные технические выпуски, деньги в ИИ и реальные реализации.
📝 От редакции: Triton: Программирование GPU для глубоких нейронных сетей
На протяжении десятилетий индустрия программного обеспечения развивалась, устраняя зависимости в аппаратных архитектурах. Разработчики не тратят циклы на размышления об аппаратной инфраструктуре при разработке веб-приложений или API. Развитие глубокого обучения, кажется, вернуло нас назад. Оптимизация архитектур графических процессоров — обычное явление в жизненном цикле моделей глубокого обучения. Команды специалистов по обработке и анализу данных часто недоумевают по поводу различий, которые топологии графических процессоров могут вызывать при выполнении нейронных сетей. Оптимизация для разделения данных, распределения памяти, распределения вычислений и других аспектов обычно выходит за рамки набора навыков большинства специалистов по данным.
Аппаратные зависимости в решениях для глубокого обучения — это и благословение, и проклятие. В некотором смысле эти зависимости привели к возрождению аппаратных инноваций ИИ. С другой стороны, большинство команд машинного обучения испытывают затруднения, когда дело доходит до оптимизации графического процессора. На этой неделе компания OpenAI, специализирующаяся на искусственном интеллекте, представила Triton, новый предметно-ориентированный язык, который абстрагируется от сложностей оптимизации графического процессора. Triton устраняет многие основные проблемы оптимизации GPU, такие как объединение памяти, управление памятью и планирование вычислений. Основная идея заключается в том, что инженер по машинному обучению без опыта работы с графическим процессором может выполнять довольно сложные оптимизации, не углубляясь в аппаратную основу. Triton представляет собой одну из самых захватывающих разработок, направленных на устранение зависимостей графического процессора, существующих сегодня в системах глубокого обучения.
🗓 На следующей неделе в TheSequence Edge:
Edge#111:что такое внимание; какая самая большая из когда-либо построенных моделей трансформеров; почему Hugging Face — самая популярная библиотека для создания и использования моделей трансформеров.
Edge#112:как компрессионный преобразователь DeepMind улучшает долговременную память в архитектурах преобразователя.
🔎 Исследование машинного обучения
Создание обычных агентов с помощью игры
DeepMind опубликовал увлекательный исследовательский документ с подробным описанием моделей агентов глубокого обучения, которые могут освоить множество различных игр без вмешательства человека -›подробнее читайте в блоге DeepMind
Сетевой накопитель с небольшим количеством снимков
Facebook AI Research (FAIR) опубликовал документ, предлагающий метод, который сочетает в себе обучение за несколько шагов и поиск нейронной архитектуры (NAS) для автоматизации создания нейронных сетей с минимальными вычислительными затратами -> подробнее в блоге FAIR
ИИ и здравый смысл
Исследователи из Массачусетского технологического института и IBM опубликовали статью, предлагающую тест для оценки признаков здравого смысла в нейронных сетях -›подробнее читайте в оригинальной исследовательской статье
🛠 Машинное обучение в реальном мире
Архитектура перемещения данных в Netflix Studio
Команда инженеров Netflix опубликовала сообщение в блоге с подробным описанием архитектуры конвейеров ETL в Netflix Studio -›подробнее читайте в блоге о технологиях Netflix.
Контейнеры и Hadoop в Uber
Команда инженеров Uber опубликовала сообщение в блоге о своем путешествии по переносу своей инфраструктуры Hadoop в контейнеры Docker -›подробнее читайте в блоге инженеров Uber
Модели настроений в Airbnb
Команда инженеров Airbnb опубликовала сообщение в блоге с подробным описанием использования моделей настроений для оценки качества обслуживания клиентов -›подробнее читайте в техническом блоге Airbnb.
🤖 Крутые релизы AI Tech
Открытый ИИ Тритон
OpenAI Triton с открытым исходным кодом, язык программирования, похожий на Python, который абстрагируется от сложностей программирования GPU -›подробнее читайте в блоге OpenAI
Повышение рейтинга TF
Google Research опубликовал подробный пост в блоге, в котором обсуждаются последние достижения в структуре TF-Ranking для масштабируемых моделей ранжирования -›подробнее читайте в блоге Google Research
💸 Деньги в ИИ
- Поздравляем корпоративную платформу разработки искусственного интеллекта DataRobot с крупным раундом финансирования серии G на сумму 300 миллионов долларов США под руководством Altimeter Capital и Tiger Global, а также с приобретением стартапа MLOps Algorithmia. 245 вакансий открыты по всему миру.
- Разработчик платформ для граничных вычислений с искусственным интеллектом Blaize привлек 71 миллион долларов в рамках финансирования серии D под руководством Франклина Темплтона и Temasek. Найм в Индии, Великобритании, США и удаленно.
- Стартап AGI Aleph Alpha привлек 27 миллионов долларов в рамках финансирования серии A под совместным руководством Earlybird VC, Lakestar и UVC Partners. Найм в Германии.
- Платформа для обмена сообщениями Гупшуп привлекла $240 млн под руководством Tiger Global Management.
- Компания Exo, занимающаяся медицинской информацией и устройствами с улучшенным ИИ, привлекла раунд инвестиций серии C на сумму 220 миллионов долларов под руководством RA Capital Management. 22 вакансии в Калифорнии.
- Разработчик программного обеспечения для диалогового взаимодействия с клиентами Dixa привлек 105 миллионов долларов в рамках раунда финансирования серии C, проводимого General Atlantic. Много вакансий в Европе, США, Израиле и удаленно.
- Фирма по роботизированному искусственному интеллекту Covariant привлекла серию C на сумму 80 миллионов долларов во главе с Index Ventures. Найм.
- Разработчик генеративных компьютерных интерфейсов Brain Technologies привлек $50 млн финансирования. Найм.
- Платформа взаимодействия с клиентами на основе искусственного интеллекта MoEngage привлекла 32,5 миллиона долларов в рамках раунда, проводимого компанией Multiples Alternate Asset Management. Найм по всему миру.
- Компания InVia Robotics, предлагающая робототехнику как услугу (RaaS), привлекла 30 миллионов долларов в рамках раунда серии C под совместным руководством Microsoft M12 Ventures и Qualcomm. Найм в Калифорнии или удаленно.
- Платформа поддержки продаж на базе искусственного интеллекта Orum привлекла раунд финансирования серии A на сумму 25 миллионов долларов под руководством Craft Ventures.
- Платформа управления и контроля киберактивами Noetic Cyber запускается с финансированием в размере 20 миллионов долларов. Найм в Бостоне, Массачусетс или удаленно.
- Помощник по заказу ИИ для ресторанов ConverseNow привлек раунд финансирования серии A на сумму 15 миллионов долларов под руководством Craft Ventures. Найм в Остине, Техас или удаленно.
- Платформа для совместной работы с данными Osmos вышла из-под контроля с финансированием в размере 13 миллионов долларов под руководством Lightspeed Venture Partners. Найм в Сиэтле, Вашингтоне или удаленно.