Статьи по теме sklearn

Публикации по теме 'sklearn'

Прогнозирование повторной госпитализации при диабете с помощью машинного обучения

Абстрактный В этой статье описывается процесс, через который я прошел, используя данные о повторной госпитализации по диабету, чтобы построить модель, которую можно было бы использовать для прогнозирования повторной госпитализации. Чтобы было ясно, это не попытка придумать практическую модель, а скорее процесс обучения машинному обучению. Цель состояла в том, чтобы проанализировать и проанализировать данные, изучить количественные и категориальные значения, собрать различные модели и..

Обработка несбалансированных данных - интуиция к реализации

Вы когда-нибудь оказывались в ситуации, когда при обучении модели машинного обучения вы получали точность выше 90%, но затем понимали, что модель предсказывает все в классе с большинством записей? Там вы действительно почувствуете запах несбалансированных данных, и теперь вы знаете, что ваша модель - пустая трата времени! Что такое несбалансированные данные ? Дисбаланс означает, что количество точек данных, доступных для разных классов, разное. Например, представьте, что у вас..

Как сделать и построить S-образную кривую с помощью sklearn

Библиотека Python по машинному обучению позволяет пользователям создавать наборы данных. Я написал несколько сообщений, в которых пользователи могут создавать наборы данных для использования в их собственных проектах по науке о данных, включая капли, круги, полумесяцы, регрессоры и классификаторы. В Python есть и другие генераторы наборов данных, которые также создают фигуры. Самый последний пост, который я сделал о методе набора данных sklearn, находится здесь: -..

Что такое случайный лес?

В моем раннем путешествии в мрачные глубины науки о данных и машинного обучения я несколько раз сталкивался с фразой Random Forest и совершенно не понимал, к чему она на самом деле относится. Сегодня я решил погрузиться и изучить концепцию. Итак, что такое случайный лес? Вот что придумала мудрая и могучая Википедия : Случайные леса или леса случайных решений — это ансамблевый метод обучения для классификации, регрессии и других задач, который работает путем построения..

Глава 2: SVM (машина опорных векторов) - Кодирование

Насколько хорошо работает машина опорных векторов по сравнению с наивным байесовским методом? Тренироваться медленнее? Давайте рассмотрим все такие вопросы в этом упражнении по кодированию. Это вторая часть главы 2: Машина опорных векторов или классификатор опорных векторов. Если вы не читали теорию (первую часть), я бы порекомендовал вам пройти ее здесь . Настоятельно рекомендуется знать основы классификатора SVM. Хотя вы получите достаточно четкое представление о реализации,..

Глубокое обучение для табличных данных?

Несмотря на всю шумиху вокруг глубокого обучения, по моему опыту, более 95% времени мы должны иметь дело с простыми файлами csv, другими словами, с табличными данными. Итак, вопрос для меня: Можем ли мы использовать глубокое обучение для табличных данных? Чтобы ответить на этот вопрос, я использовал Набор данных об удовлетворенности клиентов Sandander от Kaggle . Я выбрал этот набор, потому что он очень похож на наборы данных, с которыми обычно работают наши клиенты. И похоже,..

sk_algo_assist

Вы хотите начать с машинного обучения с библиотекой sklearn или вас беспокоит обучение каждого алгоритма из библиотеки sklearn, чтобы проверить, какой из них даст вам лучшую точность и с минимальными затратами времени? Вот решение для вас - пакет sk_algo_assist . Для новичков просто дайте pandas dataframe и столбец, по которому нужно сделать прогноз, расслабьтесь , пакет очистит данные и предоставит вам алгоритмы, обеспечивающие наилучшую точность. Ура !! ! вы изучили основы..