Публикации по теме 'data-preprocessing'
Прогнозирование движения цены акций с помощью машинного обучения
Введение:
Прогнозирование движения цен на акции — сложная задача, которая привлекла большое внимание в финансовой индустрии. В этом проекте мы будем использовать методы машинного обучения, чтобы предсказать, будет ли цена акций расти или падать, на основе исторических данных.
Код:
Во-первых, мы начнем с импорта необходимых библиотек и чтения данных:
import pandas as pd
import numpy as np
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import..
Предварительная обработка данных в машинном обучении
Предварительная обработка данных — важный этап любого проекта машинного обучения. Он включает в себя преобразование необработанных данных в формат, подходящий для построения и обучения моделей машинного обучения. В этом сообщении блога мы объясним, что такое предварительная обработка данных, почему она важна и как ее выполнять с помощью Python и некоторых популярных библиотек.
Что такое предварительная обработка данных?
Предварительная обработка данных — это процесс подготовки..
Извлечение признаков
Шаг 3 предварительной обработки данных
Часть 1: Выбор характеристик
Часть 2: Извлечение функций
Размерность данных может быть уменьшена без потери исходного набора данных.
Он извлекает или извлекает информацию из исходного набора признаков для создания нового подпространства признаков.
Эти методы также используются для:
Уменьшение количества функций из исходного набора функций Уменьшение сложности модели, переоснащение модели. Повысьте эффективность вычислений модели..
Тот самый Гамбургер!!
ОБРАБОТКА ЕСТЕСТВЕННОГО ЯЗЫКА (ЧАСТЬ II)
Далее это часть серии статей о НЛП. (Отметьте Часть I и Часть III )
Как мы видели в предыдущей статье, НЛП предоставляет интересные возможности, которые сегодня меняют многие отрасли. Круто, что компьютер может так много, но как ему это удается? О да, вы поняли, мы собираемся погрузиться в некоторые серьезные вещи!
Структура НЛП
Мы собираемся шаг за шагом построить структуру обработки естественного языка, и к концу этого «учебника»..
Улучшите предварительную обработку данных с помощью ColumnTransformer и Pipelines
Создавайте чрезвычайно настраиваемые и организованные конвейеры предварительной обработки с помощью ColumnTransformer от Sklearn.
Введение
Предварительная обработка данных, вероятно, является одним из самых трудоемких шагов в конвейере машинного обучения/науки о данных.
В большинстве реальных сценариев доступные необработанные данные являются неформатированными, грязными и неподходящими для модели машинного обучения/анализа данных, требующих нескольких этапов очистки и разработки..
Exoplanet Habitability — Руководство по предварительной обработке
НАСА подтвердило открытие около 5000 новых экзопланет в начале этого года. Машинное обучение может стать отличным инструментом для определения того, является ли какая-либо из этих экзопланет обитаемой или нет. Существует много данных о планетах, которые трудно просмотреть вручную, поэтому модели машинного обучения могут значительно ускорить процесс, автоматизируя определение (возможной) обитаемости.
Данные
Существует несколько источников данных о обитаемости экзопланет. Набор..
Шесть функций преобразования типов данных для предварительной обработки данных для машинного обучения
Включает весь код Python, предлагает цепочку панд и расширяет пакет pyjanitor.
Введение в предварительную обработку данных: преобразование типов данных
Работая инженером или специалистом по данным, вы потратите много времени на предварительную обработку данных, чтобы выполнить практическое обучение своему MLM, а затем составить точные прогнозы из вашего MLM.
Что 70% студентов, изучающих науку о данных, делают неправильно Уроки, извлеченные из..