Разберитесь с Series и DataFrame и их использованием.

Что такое панды?

Для тех из вас, кто не знаком с концепцией pandas — это библиотека Python с открытым исходным кодом, как и NumPy, которую необходимо импортировать, когда мы хотим ее использовать. Название pandas расшифровывается как «Panel-data». Это обрамляет использование библиотеки Pandas для работы с данными. В 2008 году разработчиком Уэсом МакКинни была разработана и запущена библиотека pandas. Основная цель разработки и популярности библиотеки pandas заключается в ее способности предоставлять высокопроизводительные инструменты обработки и анализа данных с использованием структур данных.

Раньше Python использовался для сбора и подготовки данных для целей анализа, но включение библиотеки pandas предоставляет аналитику доступ к использованию языка программирования Python для 5 важных этапов анализа: загрузка, подготовка, обработка, создание модели и анализ. Будет уместно сказать, что включение библиотеки pandas в язык программирования Python расширило его использование в различных областях. Сегодня Python с библиотекой pandas используется в таких областях, как эконометрика, статистика, финансы и т. д.

Структуры данных в библиотеке pandas на языке программирования Python в целом подразделяются на две категории: серии и DataFrame.

Всякий раз, когда мы хотим использовать NumPy и pandas, эти библиотеки необходимо импортировать следующим образом:

При работе с библиотекой pandas мы сталкиваемся с несколькими предупреждениями, и обычно мы хотим их игнорировать, поэтому мы импортируем предупреждения, как показано выше, и указываем «игнорировать», чтобы мы не видели их каждый раз, когда запускаем программу.

Что такое серия?

Серия в библиотеке pandas для Python представляет собой одномерный помеченный массив, способный хранить данные любого типа, будь то int, float, object и т. д. Серия — это однородный помеченный массив, размер которого неизменен.

Синтаксис:pandas.Series(data,index,dtype,copy)

Мы рассмотрим 6 различных способов создания серии:

  1. Создание пустой серии. Здесь мы просто создаем серию без указания или ввода данных.
  2. Создание серии с использованием типа данных списка. В этом случае мы указываем данные, которые представляют собой список, и, если мы хотим, мы также можем предоставить входные данные для пользовательского индекса в форме списка.
  3. Создание серии с использованием типа данных Dictionary. В этом случае мы создаем словарь с парами ключ: значение, где ключ становится индексом, а значение — данными.
  4. Создание серии с использованием объекта-массива NumPy. В этом случае мы создаем два разных объекта-массива NumPy, используя любой из методов создания объекта-массива NumPy, и связываем их как данные и индекс. Это создает ряд с нашими желаемыми данными и индексом.
  5. Создание ряда скалярных значений. В этом случае у нас есть постоянный элемент данных, и мы просто хотим указать индекс того, сколько раз мы хотим, чтобы данные были постоянными в ряду.
  6. Создание серии с заданным порядком индексов. Здесь у нас есть данные в виде словаря с парами ключ:значение, и мы знаем, что ключ займет позицию индекса, а значение будет играть роль данных. Но теперь мы можем выбрать порядок представления данных Series, указав порядок индекса.

Мы можем лучше понять все вышеперечисленные 6 способов создания серий с помощью примеров:

Что такое DataFrame?

В библиотеке pandas для Python DataFrame представляет собой двумерную структуру данных, т. е. данные выравниваются табличным образом по строкам и столбцам.

Мы рассмотрим 7 различных способов создания DataFrame:

  1. Создание пустого фрейма данных
  2. Создание DataFrame с использованием типа данных списка Python
  3. Создание DataFrame с использованием списка списков Python
  4. Создание DataFrame с использованием типа данных словаря Python
  5. Создание DataFrame с использованием объекта массива NumPy
  6. Создание DataFrame с использованием серии
  7. Создание DataFrame с использованием случайных чисел

Мы можем лучше понять все вышеперечисленные 6 способов создания серий с помощью примеров:

Помимо 7 способов создания DataFrame, мы также рассмотрим некоторые специальные функции, которые мы можем выполнять с DataFrame.

И вот оно. Спасибо за чтение.

Больше контента на plainenglish.io. Подпишитесь на нашу бесплатную еженедельную рассылку новостей. Получите эксклюзивный доступ к возможностям написания и советам в нашем сообществе Discord.