Ознакомьтесь с NVIDIA GTC (зарегистрируйтесь здесь бесплатно), чтобы понять, как Google Cloud может помочь вам преодолеть трудности, связанные с извлечением выгоды из высокопроизводительных вычислений (HPC) и машинного обучения (ML). В партнерстве с NVIDIA они могут предоставить дифференцированный опыт, позволяющий легко масштабировать большие рабочие нагрузки высокопроизводительных вычислений или переносить рабочую нагрузку машинного обучения из обучения в производственную среду.

Google Cloud и NVIDIA недавно выпустили виртуальные машины A2 на базе графического процессора NVIDIA Ampere A100 с тензорным ядром на вычислительном движке. Одна виртуальная машина A2 использует до 16 графических процессоров NVIDIA A100, поддерживаемых структурой NVIDIA's NVlink, обеспечивая эффективную производительность до 10 петафлопс для FP16 или 20 петафлопс для int8 в одной виртуальной машине. Такая производительность и масштабируемость уникальны для Google Cloud и предназначены для удовлетворения самых требовательных на сегодняшний день приложений высокопроизводительных вычислений.

Эта возможность дала Альтаир беспрецедентное время для проведения моделирования CFD с помощью ultraFluidX. DeepMind (дочерняя компания Alphabet) смогла обучить свои эксперименты с графическим процессором быстрее, чем когда-либо прежде, используя типы машин. Институт Аллена смог запустить A100 на GCP в 4 раза быстрее, чем их существующие системы. Узнайте больше о дополнении к семейству A2 VM здесь.

Создание приложений машинного обучения является сложной задачей, обслуживание приложений в производственной среде необязательно. Google Cloud предоставляет возможность оптимизировать операции машинного обучения (MLOps) для автоматизации жизненного цикла производства машинного обучения. OpenX смогла использовать инструменты GCP для автоматизации своей инфраструктуры машинного обучения и автоматизации рабочих нагрузок машинного обучения за счет использования уникальных возможностей облачной платформы Google. OpenX оптимизировал обслуживание TensorFlow, работающее на Google Kubernetes Engine, для обслуживания 2,5 миллионов запросов прогнозов в секунду менее 15 миллисекунд.

Узнайте больше на следующих сессиях Google Cloud на NVIDIA GTC:

  1. SS32947 - Получите конкурентное преимущество с помощью ML Ops: Kubeflow, NVIDIA Merlin и Google Cloud - О боже. (Представлено Google Cloud)
  2. SS32946 - Следует ли мне запускать рабочие нагрузки графического процессора: локально или в облаке? Изучение возможностей с помощью Anthos и NVIDIA из Google Cloud (представлено Google Cloud)
  3. S33262 - Смотри, мама, без компьютера! Как облако может революционизировать опыт виртуальной реальности (представлено Google Cloud)
  4. S31290 - Масштабирование обработки данных с помощью Dask + Rapids на платформе Google Cloud AI.
  5. S31579 - предотвращение антипаттернов ускоренной аналитики в облаке
  6. S31877 - От быстрого к быстрому: ИИ в реальном времени с помощью Google Cloud Dataflow и NVIDIA GPU
  7. S31564 - суперзарядка облачной вычислительной гидродинамики с архитектурой NVIDIA Ampere
  8. S31137 - подробное описание поддержки многооконных графических процессоров в контейнерах и Kubernetes
  9. S31071 - Производство машинного обучения с помощью операций машинного обучения и облачного искусственного интеллекта
  10. S31498 - XLA-компиляция в TensorFlow с tf.function (jit_compile = True)
  11. S31798 - Стандартизация API массивов для Python в средах глубокого обучения
  12. S31799 - Что нового в TensorFlow - обновление экосистемы
  13. S31925 - Keras и TensorFlow: следующие пять лет
  14. S31732 - вывод с помощью Tensorflow 2.x, интегрированного с сеансом TensorRT
  15. S31376 - Масштабное машинное обучение в Google Cloud
  16. S31743 - GShard: масштабирование гигантских моделей с условным вычислением и автоматическим сегментированием
  17. S32508 - раскрытие возможностей искусственного интеллекта в Латинской Америке через сообщества разработчиков
  18. S31742 - предоставление интерактивного виртуального опыта с использованием Unreal Engine и Google Cloud
  19. S31647 - Упростите создание двухбашенных согласующих энкодеров для улучшения результатов рекомендаций по ближайшему соседу
  20. S32518 - начните работу с ИИ для обработки медицинских изображений с помощью Clara Train на платформе Google Cloud.