Публикации по теме 'r'
Holos — День 2 — Урок по типам данных
Мы закончили предыдущую публикацию, соскребя небольшой объем данных, касающихся результатов матчей и очков для набора матчей в определенный день, в котором данные были не в том виде, в котором они были нам нужны. Стоит сделать небольшую резервную копию. и объясняя далее, что это значит, поскольку это служит поучительным примером в Python — и в программировании в более широком смысле. Одна из причин того, что данные в том виде, в котором мы были, не работали, связана с типами данных ...
Визуализация дерева решений с помощью R
Деревья решений - одни из самых популярных алгоритмов машинного обучения, используемых в промышленности, поскольку они достаточно интерпретируемы и интуитивно понятны. Более того, они имитируют логические рассуждения людей.
Базовый рецепт любого дерева решений очень прост: мы начинаем выбирать в качестве корневого одну функцию, разделяем ее на разные ветви, которые заканчиваются на узлы, а затем, если необходимо, продолжаем дальнейшее разбиение на другие функции. Наконец, мы возвращаемся..
Как продавать кулинарную книгу с умом. Другой взгляд на ИИ
Я знаю, на первый взгляд сравнение сервисов искусственного интеллекта с поваренными книгами может показаться несколько смелым, но, пожалуйста, попробуйте понять мою мысль: в обоих случаях вы продаете нематериальные товары; в обоих случаях эти нематериальные товары требуют тщательного исполнения покупателями; В обоих случаях для достижения полезных результатов требуются нестандартные уровни способностей. Я здесь не для того, чтобы предложить новое шоу, подобное «Адской кухне», для..
Графики Python Seaborn в R с использованием ретикулята
Я думаю, что нет никаких споров о том, насколько ggplot2 потрясающе. Но есть пара графиков, которые мне нравятся в современной библиотеке визуализации данных Python Seaborn . Это не только обеспечивает высококачественную визуализацию, но и то, насколько легко и просто создать ее. Эти два графика - heatmap и pairplot . Я всегда скучал по ним, но, думаю, больше нет.
Что, если я скажу вам, что теперь вы можете построить эту тепловую карту Seaborn и парный график в R с помощью..
Как улучшить производительность вневыборочной модели с помощью Dropout
Узнайте, как повысить производительность модели за пределами выборки с помощью отсева, из этого руководства Марка Ходнетта, специалиста по данным с более чем 20-летним опытом разработки программного обеспечения, систем бизнес-аналитики и обработки данных .
Dropout — это новый подход к регуляризации, который особенно ценен для больших и сложных глубоких нейронных сетей. Концепция отсева на самом деле довольно проста. Во время обучения модели единицы (например, входные и скрытые нейроны)..
Недодискретизация по группам в R
Как применять недостаточную выборку при работе с несбалансированными данными
Есть много подходов, которым вы можете следовать при работе с несбалансированными классами в проектах машинного обучения. Просто выделим некоторые из них:
Недостаточная выборка : мы стараемся уменьшить количество наблюдений из класса большинства, чтобы окончательный набор данных был сбалансированным. Передискретизация : мы стараемся получить больше наблюдений из класса меньшинства, обычно путем..
Изучение алгоритма кластеризации K-средних
В реальной жизни мы часто сталкиваемся с проблемами при выборе идеальной для нас группы. Мы ищем среди членов нашей группы различные качества и особенности, которые нам больше всего подходят, а затем решаем, быть ее частью или нет. Этот процесс часто занимает много времени и может привести к неправильным результатам. Но в таких языках программирования, как R, простой код из нескольких строк формирует для вас лучшие кластеры, скажем, менее чем за минуту. Это еще одна функция, которая..