Публикации по теме 'data-visualization'


Вероятность и статистика для энтузиастов данных: часть 3. Диаграммы рассеяния Seaborn
В следующих нескольких частях я расскажу о нескольких различных типах графиков и о том, как их кодировать в Python. В список входят следующие графики: точечные диаграммы, диаграммы ствола и листа, гистограммы, круговые диаграммы и коробчатая диаграмма с усами. В основном я буду использовать пакеты Seaborn для визуализации и добавлять ссылку на документацию везде, где это необходимо. В этой статье мы рассмотрим диаграммы рассеяния . Точечная диаграмма . Точечная диаграмма..

Анализ твитов с использованием наивного байесовского алгоритма на языке R
В этом блоге мы анализируем настроения твитов, которые имели место во время президентских дебатов в августе 2016 года в Огайо. Мы провели как категоризацию данных, так и анализ контента, чтобы ответить, был ли твит релевантным, какой кандидат упоминал больше всего в твитах и ​​тональность твита. Считайте данные в R, данные также доступны в базе данных SQL, но здесь мы загрузили файл CSV в R. data=read.csv("Sentiment.csv") head(data) Структурирование данных - самая важная..

Многомерный анализ временных рядов качества воздуха с использованием регрессора случайного леса
Введение Временные ряды — это тип последовательных данных, содержащих точки данных, отображаемые в определенный последовательный период времени. Это может варьироваться в единицах времени, от секунд до часов, от дней до недель и от месяцев до лет. Временные ряды используются в разных секторах, чтобы увидеть, как определенная переменная изменяется со временем. Например, наиболее популярно использование временных рядов на финансовых рынках для отслеживания изменений в цене и объеме..

Роль специалистов по данным
Введение. В современном мире, где все зависит от данных, профессия специалиста по обработке и анализу данных стала одной из самых востребованных и интересных профессий. В связи с постоянно растущим объемом генерируемой информации специалисты по данным обладают навыками и опытом для преобразования необработанных данных в ценные идеи, выявления скрытых закономерностей и обеспечения принятия обоснованных решений. Этот пост в блоге призван пролить свет на увлекательный мир науки о данных,..

Data-lakehouse — Как справиться с изменением парадигмы данных — Руководство по принятию решений CDO
Худший кошмар главного директора по информационным технологиям уже здесь. Большинство облачных OEM-производителей — поставщики большинства хранилищ данных обещают работать со структурированными, полуструктурированными, потоковыми, пакетными, потоковыми и неструктурированными данными с помощью одного термина «озерный дом». В современном мире захвата рынка Data Lakehouse — общего определения для всех OEM-производителей — говорится, что DataLakehouse — это открытая архитектура управления..

Как я получил работу старшего специалиста по данным
Часть 2: размышления и советы Это вторая часть серии сообщений. Если вы хотите увидеть данные о том, на какие вакансии я подавал заявки и как я продвигался через собеседования, ознакомьтесь с частью 1 здесь . Кажется, в Интернете много материалов о том, как получить первую работу в области науки о данных, но не о том, как делать вертикальные шаги с должности младшего или среднего звена. Шесть месяцев назад я начал новую работу в качестве старшего специалиста по данным и..

Как создать миниатюру нестандартного размера в Python с помощью Pillow
Быстро создавайте миниатюры для своих социальных сетей, блогов и других веб-сайтов. Привет, мир! Сегодня мы рассмотрим, как использовать PIL для изменения размера и обрезки изображения для создания миниатюры. Для этого урока мы собираемся: Изменение размера изображения с сохранением его исходных пропорций в зависимости от размера, который мы решили Обрезать изображение до нужного размера, начиная с центра изображения Сохраните изображение в формате JPEG Как обычно, я..