Публикации по теме 'data-visualization'
Оценивать модель по показателям производительности бесполезно. Почему? (Часть 1)
Прежде всего, мы все, должно быть, почувствовали, что нас неправильно оценивают в школе и колледжах, потому что все учащиеся оцениваются по оценкам. Все ученики, хорошо умеющие рисовать, плавать и запоминать заметки, получали одинаковую оценку. Если так же оценивать нашу модель, то она на 100% бесполезна.
Например, как ученики, хорошо владеющие плаванием, должны соревноваться и оценивать свои выступления с другими пловцами, нам нужно выбрать правильный показатель для оценки работы модели...
ВВЕДЕНИЕ В QUANDL - # 70DaysofMLStudy с Data Science Nigeria
ВВЕДЕНИЕ
Броская фраза на веб-сайте гласит: « Самые важные данные в мире живут на Quandl . Это правда? Давайте разберемся.
Quandl - канадский стартап, который начинал с цели создания чего-то вроде Википедии для «Количественных данных». Задача заключалась в том, чтобы упростить доступ к данным, их использование и поиск без утомительного поиска в Интернете.
Quandl была основана в 2011 году и превратилась в один из самых мощных мировых ресурсов данных. Платформа обеспечивает..
О важности данных для обучения алгоритмов машинного обучения — Часть первая
Данные играют жизненно важную роль в построении алгоритмов машинного обучения. Часто специалисты по машинному обучению игнорируют важность качества данных и ищут «лучшие» алгоритмы машинного обучения. В этой серии я планирую рассмотреть различные характеристики данных, которые повлияют на качество результирующего алгоритма машинного обучения.
Мы рассмотрим следующие характеристики данных, которые повлияют на модель машинного обучения:
Количество записей, доступных для обучения..
Обширный анализ EDA и прогнозирование подписки клиентов (в приложении).
В этой статье объясняются различные аспекты науки о данных, которые применяются для прогнозирования того, подпишется ли клиент на премиум-функцию приложения.
У нас есть набор данных, который состоит из сведений о пользователе и показывает, зарегистрировался ли конкретный пользователь на премиум-версию для этого приложения. Мы будем использовать этот набор данных для определения различных идей, скрытых в наборе данных, а также использовать этот набор данных для построения некоторой модели..
Как создать идеальное дерево решений?
Дерево решений имеет много аналогий в реальной жизни и, как оказалось, повлияло на широкую область машинного обучения , охватывающую как классификацию, и Регрессия . В анализе решений дерево решений можно использовать для визуального и явного представления решений и принятия решений.
Итак, схема того, что я буду освещать в этом блоге, выглядит следующим образом.
Что такое дерево решений? Преимущества и недостатки дерева решений Создание дерева решений
Что такое дерево..
Конкретное приложение анализа топологических данных
Сегодня я представлю приложение для машинного обучения Топологического анализа данных (TDA), быстро развивающейся области науки о данных, в которой топология используется для улучшения анализа данных. Во многом он вдохновлен одним из моих проектов .
Большой! Подождите ... что такое TDA?
Начну с того, что кратко напомню основы TDA. Заинтересованный читатель может также захотеть взглянуть на другие истории (и все ссылки в них) для получения более подробной информации.
TDA - это..
5 премиальных курсов, к которым вы можете получить доступ бесплатно в этом месяце
Udacity предлагает один месяц премиальной степени бесплатно, поддерживая кризис Covid-19.
Находиться в карантине может быть непросто, но это позволяет нам сэкономить много времени, чтобы сосредоточиться на саморазвитии и освежить свои навыки как аналитика данных. Чтобы поддержать профессионалов в это время, Udacity предоставляет один месяц бесплатного доступа к премиальной программе Nanodegree по вашему выбору (примечание: предложение действует только для Европы и США). На..