Публикации по теме 'data'
Прогнозирование цен на недвижимость на Манхэттене с помощью деревьев регрессии и GridSearchCV
Деревья решений служат для прогнозирования двух типов данных: категориальных (деревья классификации) и числовых (деревья регрессии). Идея этого алгоритма контролируемого обучения состоит в том, чтобы задать несколько «вопросов», чтобы создать правила принятия решений, которые приводят к нахождению «ответа».
Набор данных, используемый в этой статье, был создан на основе данных Департамента финансов Нью-Йорка .
Простота — это то, что я бы назвал основной характеристикой деревьев..
Проблема с нулевой частотой
В наивном байесовском классификаторе
Наивный Байес хорошо работает в случае категориальных данных по сравнению с числовыми данными .
Проблема нулевой частоты. Если у экземпляра в наборе тестовых данных есть категория, которой не было во время обучения, то он присвоит ей «нулевую» вероятность и не сможет сделать прогноз. Это искажает всю производительность классификации.
Контроль версий для науки о данных - отслеживание моделей и наборов данных машинного обучения
Контроль версий для проектов машинного обучения с использованием DVC
Я бог Git, зачем мне еще одна система контроля версий для проектов машинного обучения?
Несомненно, GIT - это Святой Грааль систем управления версиями! Git отлично подходит для управления версиями исходного кода. Но в отличие от разработки программного обеспечения, в проектах Data Science есть дополнительные большие файлы, такие как наборы данных, файлы обученных моделей, кодировки меток и т. Д., Размер которых..
Случай с машинным SQL
Мы приближаемся к будущему, в котором такие компании, как Snowflake и Databricks, станут основой работы с данными каждой организации. Это удовольствие для инженеров данных, инженеров-аналитиков, специалистов по данным и других, которые решили потратить время на оттачивание технических навыков, необходимых для получения максимальной отдачи от этих новых платформ. Однако на каждого любителя SQL (включая этого автора) приходится 99 человек, которые просто хотят использовать данные, чтобы..
Условное выражение MySQL WHERE с числовыми данными
Мы знаем, что при фильтрации текстовых данных в условном предложении MySQL WHERE строки помещаются в одинарные кавычки. В этом сообщении блога вы узнаете, как фильтровать числовые данные в условном предложении MySQL WHERE …
Получите копию моей электронной книги 10 советов по MySQL для всех , когда подпишитесь на информационный бюллетень OpenLampTech .
При фильтрации числовых данных в условном предложении WHERE не следует заключать данные фильтра в одинарные кавычки...
Поведение вариационных автоэнкодеров, часть 4 (машинное обучение)
Вариационные автоэнкодеры Лапласа (arXiv)
Автор: Юкун Пак , Крис Донджу Ким , Гунхи Ким .
Аннотация: Вариационные автоэнкодеры используют амортизированную модель вывода для аппроксимации апостериорных значений скрытых переменных. Однако такой амортизированный вариационный вывод сталкивается с двумя проблемами: (1) ограниченная апостериорная выразительность полностью факторизованного предположения Гаусса и (2) ошибка амортизации модели вывода. Мы представляем новый подход, который..
Показывать данные при наведении курсора мыши с помощью d3.js
В проекте данных вы дошли до того момента, когда хотите добавить эффекты при наведении курсора мыши. Прежде всего, поздравляю! Вы построили график! Если вы еще не построили график, я предлагаю следовать моему руководству по кольцевой диаграмме . Я буду использовать это здесь, так что это может быть полезным справочником.
Куда должен идти код при наведении указателя мыши?
Для начала давайте разберемся, где должен быть этот код. Взглянув на наш пример кольцевой диаграммы, давайте..