Публикации по теме 'data-visualization'


Оценивать модель по показателям производительности бесполезно. Почему? (Часть 1)
Прежде всего, мы все, должно быть, почувствовали, что нас неправильно оценивают в школе и колледжах, потому что все учащиеся оцениваются по оценкам. Все ученики, хорошо умеющие рисовать, плавать и запоминать заметки, получали одинаковую оценку. Если так же оценивать нашу модель, то она на 100% бесполезна. Например, как ученики, хорошо владеющие плаванием, должны соревноваться и оценивать свои выступления с другими пловцами, нам нужно выбрать правильный показатель для оценки работы модели...

ВВЕДЕНИЕ В QUANDL - # 70DaysofMLStudy с Data Science Nigeria
ВВЕДЕНИЕ Броская фраза на веб-сайте гласит: « Самые важные данные в мире живут на Quandl . Это правда? Давайте разберемся. Quandl - канадский стартап, который начинал с цели создания чего-то вроде Википедии для «Количественных данных». Задача заключалась в том, чтобы упростить доступ к данным, их использование и поиск без утомительного поиска в Интернете. Quandl была основана в 2011 году и превратилась в один из самых мощных мировых ресурсов данных. Платформа обеспечивает..

О важности данных для обучения алгоритмов машинного обучения — Часть первая
Данные играют жизненно важную роль в построении алгоритмов машинного обучения. Часто специалисты по машинному обучению игнорируют важность качества данных и ищут «лучшие» алгоритмы машинного обучения. В этой серии я планирую рассмотреть различные характеристики данных, которые повлияют на качество результирующего алгоритма машинного обучения. Мы рассмотрим следующие характеристики данных, которые повлияют на модель машинного обучения: Количество записей, доступных для обучения..

Обширный анализ EDA и прогнозирование подписки клиентов (в приложении).
В этой статье объясняются различные аспекты науки о данных, которые применяются для прогнозирования того, подпишется ли клиент на премиум-функцию приложения. У нас есть набор данных, который состоит из сведений о пользователе и показывает, зарегистрировался ли конкретный пользователь на премиум-версию для этого приложения. Мы будем использовать этот набор данных для определения различных идей, скрытых в наборе данных, а также использовать этот набор данных для построения некоторой модели..

Как создать идеальное дерево решений?
Дерево решений имеет много аналогий в реальной жизни и, как оказалось, повлияло на широкую область машинного обучения , охватывающую как классификацию, и Регрессия . В анализе решений дерево решений можно использовать для визуального и явного представления решений и принятия решений. Итак, схема того, что я буду освещать в этом блоге, выглядит следующим образом. Что такое дерево решений? Преимущества и недостатки дерева решений Создание дерева решений Что такое дерево..

Конкретное приложение анализа топологических данных
Сегодня я представлю приложение для машинного обучения Топологического анализа данных (TDA), быстро развивающейся области науки о данных, в которой топология используется для улучшения анализа данных. Во многом он вдохновлен одним из моих проектов . Большой! Подождите ... что такое TDA? Начну с того, что кратко напомню основы TDA. Заинтересованный читатель может также захотеть взглянуть на другие истории (и все ссылки в них) для получения более подробной информации. TDA - это..

5 премиальных курсов, к которым вы можете получить доступ бесплатно в этом месяце
Udacity предлагает один месяц премиальной степени бесплатно, поддерживая кризис Covid-19. Находиться в карантине может быть непросто, но это позволяет нам сэкономить много времени, чтобы сосредоточиться на саморазвитии и освежить свои навыки как аналитика данных. Чтобы поддержать профессионалов в это время, Udacity предоставляет один месяц бесплатного доступа к премиальной программе Nanodegree по вашему выбору (примечание: предложение действует только для Европы и США). На..