Определение в литературе: Межотраслевой стандартный процесс интеллектуального анализа данных, известный как CRISP-DM, представляет собой открытую стандартную модель процесса, описывающую общие подходы, используемые экспертами по интеллектуальному анализу данных. Это наиболее широко используемая модель аналитики.

Основываясь на текущих исследованиях, CRISP-DM является наиболее широко используемой формой модели интеллектуального анализа данных из-за ее различных преимуществ, которые решают существующие проблемы в отраслях интеллектуального анализа данных.

Во-первых, Проблема должна быть определена при составлении бизнес-плана, проблема может мыслиться как просьба, запрос; Это феномен, который нельзя сделать, определить или определить.

При определении должна быть создана модель желаемой ситуации. Эту модель можно рассматривать как функцию:
y = x1*b1+x2*b2+…xp*bp
Затем осуществляется доступ к источникам данных и выполняется операция.
Здесь мы не должны забывать об этом; как специалист по данным, мы не знаем, какой здесь будет результат, чтобы не задавать вопросы, как конечный пользователь; Нам нужно смотреть на особенности больших данных и анализировать особенности миллионов продуктов, в каких условиях и при каких условиях.

Данные: Любая «Необработанная» модель перечисленных товаров. Чтобы эти данные были проанализированы и поняты, нам необходимо подробно проанализировать их и привести в удобную форму.

Вот петля:

  • Понимание бизнеса
  • Понимание данных
  • Подготовка данных
  • Моделирование
  • Оценка
  • Развертывание

Прежде чем перейти к этапу моделирования, существующие данные необходимо очистить, очистить от ошибок и выбросов. Нам нужно избавиться от зашумленных данных, таких как фраза рынок на торговой площадке.

Моделирование — это обучение функций алгоритмам. Этот этап обучения позволит нам увидеть влияние вышеперечисленных факторов на результат. Первое, что определит процесс, — это определение Направления и Интенсивности выражения.
Моделирование = b0 + x1*b1+x2*b2+…xp*bp
Здесь значения x найдут свое направление. (отрицательно-положительно) и интенсивность.

Оценка есть; оценивает свою работу. Оценивает и тестирует оценочное конечное значение.

В момент ввода в эксплуатацию; Возникла проблема, компания и высшее руководство усвоили этот процесс и отправили его в науку о данных, попытались понять данные, используя источники данных компании, подготовили, смоделировали, оценили и создали функцию оценки перед моделированием, доработали ее в пригодном для использования виде.

Чтобы прочитать данные в этом процессе, вы должны знать такие основы, как

строка и Int
len
полоса
заменить
переменные
подстрока

В моей следующей статье мы начнем анализировать данные со Spyder IDE на начальном уровне.

print("спасибо за прочтение")