Публикации по теме 'data-visualization'
5 лучших онлайн-курсов по науке о данных в 2022 году
Вы ищете лучшие курсы по науке о данных, доступные в 2022 году
Я сократил лучшие курсы по науке о данных, доступные для списка ниже, потратив много лет и более 100 часов на просмотр видео курсов, участие в викторинах и заданиях, а также на чтение обзоров на различных агрегаторах и форумах.
5 лучших курсов по науке о данных
1. Специализация Data Science
2. Полный курс по науке о данных: математика, статистика, Python, расширенная статистика в Python, машинное и глубокое обучение..
Практическое тематическое моделирование с помощью Python
Учебное пособие по тематическому моделированию с использованием скрытого распределения Дирихле (LDA) и визуализации с помощью pyLDAvis.
Тематическое моделирование — популярный метод обработки естественного языка (NLP) и анализа текста для извлечения тем из заданного текста. Используя тематическое моделирование, мы можем сканировать большие объемы неструктурированного текста, чтобы определять ключевые слова, темы и темы.
Тематическое моделирование — это метод машинного обучения без..
Графики Ridgeline: визуализируйте данные с радостью!
Введение
Распределение данных играет важную роль в построении модели. Визуализируя данные, можно сделать вывод о том, какой тип распределения они представляют. Поскольку многие статистические тесты требуют нормального распределения данных, всегда полезно работать над нормальным распределением данных. Графики распределения также помогают выявлять выбросы и обрабатывать их. Можно получить приблизительную оценку разброса данных на основе распределения.
Python имеет несколько библиотек и..
A2: Основы Python (часть 1): типы данных
Эта статья является частью серии «Наука о данных с нуля — могу ли я, чтобы я могла» .
Нажмите здесь, чтобы перейти к предыдущей статье/лекции «A1: введение в курс и настройка среды .»
Все мы знаем, что Python является основным языком для Data Science. Мы также знаем, что изучение Python для целей разработки сильно отличается от обучения Data Science. Не втягивая вас, ребята, в ненужную дискуссию, давайте перейдем к основной цели и изучим самые важные и ключевые концепции..
Анализ главных компонентов (PCA)
Когда мы начинаем изучать что-то новое, мы обычно пугаемся ужасных модных словечек. Итак, давайте разберемся с анализом основных компонентов (PCA) простыми словами, используя полную терминологию.
Итак, начнем с его использования.
Анализ основных компонентов просто используется для преобразования ваших данных более высокого измерения в более низкое измерение. Давайте рассмотрим, что ваши данные имеют n-размерность, и из-за очень больших размерностей очень сложно получить правильные и..
Отчет о фрейме данных Fantastic Pandas с профилированием Pandas
Выведите базовую отчетность на новый уровень
Как специалист по данным, мы будем изучать данные для повседневной работы. Для Pythonist использование модуля Pandas просто необходимо. Несмотря на убедительность, иногда мы обнаруживаем, что отчет слишком прост. Позвольте мне показать это на примере ниже.
import pandas as pd
import seaborn as sns
#Loading dataset
mpg = sns.load_dataset('mpg')
mpg.describe()
Мы могли бы получить фундаментальную статистику, используя атрибут..
Интерактивная отчетность в Jupyter Notebook
Взгляд на репортажи в Jupyter под новым углом
Jupyter Notebook - важная стрелка в колчане специалистов по анализу данных. Это приложение с открытым исходным кодом является гибким и, что самое главное, интерактивным . Это инструмент, который вам нужен для базовых задач науки о данных, таких как очистка данных, построение визуализаций, создание моделей машинного обучения и многое другое. Вы можете написать здесь код Python или R (в зависимости от используемого ядра), сохранить..