Статьи по теме apache-spark

Публикации по теме 'apache-spark'

Прогнозирование оттока пользователей - Apache Spark

Определение проекта Я всегда стремлюсь изучать новые фреймворки и расширять свои возможности, поэтому, когда я услышал о возможности проекта, использующего Apache Spark и Hadoop, я был уже очень заинтригован. Изучив основы API PySpark Apache Spark, нет лучшего способа продемонстрировать мастерство машинного обучения, чем в контексте больших данных. Этот проект вращается вокруг ключевой бизнес-проблемы, с которой сталкиваются многие фирмы; Как узнать, какие клиенты хотят уйти, и как..

Прогнозирование оттока пользователей с помощью Spark

Ученый Udacity Data Scientist, программа по нанодипломам Capstone Project Этот проект является заключительным проектом программы Udacity Data Scientist Nanodegree: Data Scientist Capstone. Цель состоит в том, чтобы предсказать, перейдет ли пользователь на вымышленный цифровой музыкальный сервис Sparkify . Прогнозирование оттока клиентов - один из самых популярных вариантов использования больших данных в бизнесе. Как лучше объяснено в этом сообщении , его цель - определить,..

Потоковое ML CI/CD за несколько дней: как мы улучшили нашу простую в использовании систему доставки кода для Spark…

Обзор Значимой тенденцией развития ИТ-бизнеса в настоящее время является готовность к работе с горячими данными, время жизни которых с момента их появления может составлять менее секунды. Допустим, вы приходите в магазин и берете кредит на покупку телефона. Вы хотите получить кредит на выгодных условиях. И банк хочет дать кредит проверенному клиенту. Временное окно, в котором вам нужны кредитные деньги, относительно короткое. Пример из домена Telecom. У вас закончились деньги, а в..

Глубокое обучение с Apache Spark - Часть 2

Вторая часть полного обсуждения того, как выполнять распределенное глубокое обучение с Apache Spark. Я полностью сосредоточусь на библиотеке конвейеров DL и на том, как использовать ее с нуля. Одна из вещей, которые вы увидите, - это перенос обучения на простом конвейере, как использовать предварительно обученные модели для работы с «небольшими» объемами данных и возможность предсказывать вещи и многое другое. Всем привет и добро пожаловать обратно в учебу :). В этой статье я..

Apache Ignite - Использование сетки памяти для сред распределенных вычислений (Spark и Flink)

Достижение ускорения вычислений для TempusML Акшай Метре, разработчик TempusML TempusML и Apache Ignite Во время работы над Tempus ML , новым ускорителем студии машинного обучения в Hashmap, мне понадобилась платформа, которая позволила бы мне эффективно управлять данными между элементами вычислений. В частности, я хотел избежать записи на диск или записи в базу данных между дискретными вычислительными шагами. Я искал что-то, что позволило бы мне легко передавать результаты..