Публикации по теме 'k-means'
Раскрытие секрета удержания клиентов: анализ риска оттока пользователей веб-сайта электронной коммерции
Ссылка на код Kaggle для справки: https://www.kaggle.com/code/karanp/uncovering-the-secret-to-customer-retention/notebook?scriptVersionId=124219418
Добро пожаловать в мир электронной коммерции, где борьба за удержание клиентов является более конкурентной, чем когда-либо. Представьте себе: вы вложили свое сердце и душу в создание интернет-магазина, привлечение клиентов и увеличение продаж. Но так же быстро, как клиенты пришли, они начинают исчезать. Вам остается только гадать, что..
Неконтролируемое машинное обучение для сегментации клиентов
Практический пример машинного обучения
Ирэн Риверо (01.13.2023)
Этот проект посвящен созданию алгоритма неконтролируемого машинного обучения K-mean в Scikit-Learn для выполнения сегментации клиентов. Мы выполним следующие задачи:
Понять постановку проблемы и бизнес-кейс Импорт библиотек и наборов данных Визуализируйте и исследуйте наборы данных Используйте библиотеку Scikit-Learn, чтобы найти оптимальное количество кластеров с помощью метода локтя. Применение k-средних с..
Неконтролируемое обучение: обнаружение скрытых закономерностей в данных
Ключевые слова: машинное обучение, глубокое обучение, ИИ, наука о данных, данные.
Введение
В мире машинного обучения существуют разные подходы, помогающие компьютерам учиться и делать прогнозы. Одним из популярных подходов является контролируемое обучение, когда компьютеру предоставляются помеченные обучающие данные для обучения. Однако есть еще одна увлекательная область, называемая неконтролируемым обучением, в которой немаркированные данные используются для обнаружения скрытых..
Группирование звездных отелей в Индонезии с помощью кластерного анализа K-средних (применяется в R)
Кластеризация - это широкий набор методов для поиска подгрупп наблюдений в наборе данных. Когда мы группируем наблюдения, мы хотим, чтобы наблюдения в одной группе были похожими, а наблюдения в разных группах - разными. Поскольку нет переменной ответа, это неконтролируемый метод, что означает, что он пытается найти отношения между nn наблюдениями без обучения с помощью переменной ответа. Кластеризация позволяет нам определить, какие наблюдения похожи, и потенциально распределить их по..
Знакомство с офисами WeWork в Лондоне
Контекст: в настоящее время я получаю сертификат IBM Data Science Professional Certificate на Coursera . Этот пост в блоге является частью требований к проекту Applied Data Science Capstone для сертификации. Ищите блог о моем опыте прохождения сертификации, когда я закончу!
Введение: бизнес-проблема
Задний план
Учитывая последние годы, которые я провел, работая с технологическими стартапами, я имел удовольствие проводить много времени в офисах WeWork по всему миру. Меня..
Сопоставление муниципалитетов Брюсселя и Любляны с помощью Foursquare и ML
Брюссель является столицей Бельгии и административным центром Европейского Союза. Людям, которые хотят работать в одном из европейских институтов, часто приходится туда переезжать. Переезд в столицу другой страны — это большой шаг, поэтому было бы полезно знать, что вы переезжаете в такой же район, в котором вы жили в своей родной стране.
Цель этого проекта — определить, какие районы Брюсселя ближе всего подходят к Любляне, используя данные Foursquare и кластеризацию K-средних.
Я..
Изучение алгоритма кластеризации K-средних
В реальной жизни мы часто сталкиваемся с проблемами при выборе идеальной для нас группы. Мы ищем среди членов нашей группы различные качества и особенности, которые нам больше всего подходят, а затем решаем, быть ее частью или нет. Этот процесс часто занимает много времени и может привести к неправильным результатам. Но в таких языках программирования, как R, простой код из нескольких строк формирует для вас лучшие кластеры, скажем, менее чем за минуту. Это еще одна функция, которая..