Вопросы по теме 'pandas-groupby'

Python - функции прокрутки для объекта GroupBy
У меня есть объект временного ряда grouped типа <pandas.core.groupby.SeriesGroupBy object at 0x03F1A9F0> . grouped.sum() дает желаемый результат, но я не могу заставить Rolling_sum работать с объектом groupby . Есть ли способ применить...
87637 просмотров

Лучший способ добавить групповые итоги в фрейм данных в Pandas
У меня есть простая задача, и мне интересно, есть ли лучший/более эффективный способ сделать это. У меня есть кадр данных, который выглядит так: Group Score Count 0 A 5 100 1 A 1 50 2 A 3 5 3 B...
5700 просмотров
schedule 26.11.2022

Pandas Groupy берет только первые N групп
У меня есть DataFrame, который я хочу сгруппировать по идентификатору, например. грамм.: import pandas as pd df = pd.DataFrame({'item_id': ['a', 'a', 'b', 'b', 'b', 'c', 'd'], 'user_id': [1,2,1,1,3,1,5]}) print df Что генерирует:...
16489 просмотров
schedule 27.02.2023

reset_index () в исходные индексы столбцов после группы pandas ()?
Я создаю сгруппированный кадр данных df = df.groupby(['X','Y']).max() , который затем хочу записать (в csv, без индексов). Поэтому мне нужно преобразовать «X» и «Y» обратно в обычные столбцы; Я пытался использовать reset_index() , но порядок...
1849 просмотров
schedule 03.06.2022

Как получить доступ к столбцу MultiIndex после groupby в пандах?
В одноиндексированном фрейме данных столбцы доступны в группе по объектам: df1 = pd.DataFrame({'a':[2,2,4,4], 'b': [5,6,7,8]}) df1.groupby('a')['b'].sum() -> a 2 11 4 15 Но в кадре данных MultiIndex, когда он не группируется по...
2023 просмотров

Pandas groupBy с условной группировкой
У меня есть два кадра данных, и мне нужно сгруппировать первый на основе некоторых критериев из второго df. df1= summary participant_id response_date 0 2.0 11 2016-04-30 1 3.0 11 2016-05-01 2...
250 просмотров
schedule 15.03.2024

groupby и возвращает все строки первых n групп
У меня есть кадр данных pandas, как показано ниже. >>> df.head() 0 1 2 3 4 5 6 0 35000 26009 OPTIDX BANKNIFTY XX 1499351400 BANKNIFTY1770621000CE 1 35001 26009 OPTIDX...
1903 просмотров
schedule 19.08.2022

ValueError: невозможно переиндексировать с повторяющейся оси без повторяющихся значений оси
Я группирую кадр данных по годам (это один уровень мультииндекса по столбцам), применяя функцию, которая дополняет df до 11 столбцов (добавляя столько пустых столбцов, сколько необходимо), а затем возвращая мягкий дф. Но это вызывает ошибку....
2280 просмотров
schedule 22.02.2024

Как я могу вычислить абсолютную сумму с помощью группы в пандах?
Как я могу вычислить абсолютную сумму с помощью группы в пандах? Например, учитывая DataFrame: Player Score 0 A 100 1 B -150 2 A -110 3 B 180 4 B 125 Я хотел бы иметь общий счет для игрока А...
11606 просмотров
schedule 22.03.2023

Переиндексация Pandas для заполнения пропущенных дат или лучший метод для заполнения?
Мои данные - это записи об отсутствии с завода. В некоторые дни нет пропусков, поэтому для этого дня нет данных или даты. Однако, и там, где это становится неуместным с другими показанными примерами, в любой день может быть несколько отсутствий по...
1580 просмотров
schedule 18.02.2023

Как выполнить условный подсчет после groupby в кадре данных Pandas?
У меня есть следующий кадр данных: key1 key2 0 a one 1 a two 2 b one 3 b two 4 a one 5 c two Теперь я хочу сгруппировать фрейм данных по key1 и подсчитать столбец key2 со значением "one" , чтобы получить...
61601 просмотров
schedule 28.10.2022

Панды объединяют, масштабируют и поворачивают длинные и широкие кадры данных
У меня есть два кадра данных Pandas, которые мне нужно объединить. Первый представляет собой полный набор данных, содержащий мои продажные цены на товары с различными интервалами количества. Цены снижаются по мере увеличения количества приобретаемых...
264 просмотров
schedule 12.01.2024

Невозможно построить Pandas groupby данные точечной диаграммы и линейных графиков
Я пытаюсь построить серию сгруппированных по таблице 1 в виде точечной диаграммы с кадрами данных, сгруппированными по таблице 2, в виде линейных графиков, в которых все они представлены на одной диаграмме. Мне не удалось совместить их. Тем не...
804 просмотров

Как получить непрерывный поминутный агрегат с пандами?
У меня есть таблица БД, содержащая столбец даты и времени со значениями, растянувшимися на 24 часа. Если я использую функцию группировки pandas dataframe groupby для минутной агрегации, это приведет к тому, что все будет разбито на 0-59 ведер...
107 просмотров
schedule 31.01.2023

как агрегировать только числовые столбцы в кадре данных смешанного типа dtypes
У меня смешанный pd.DataFrame : import pandas as pd import numpy as np df = pd.DataFrame({ 'A' : 1., 'B' : pd.Timestamp('20130102'), 'C' : pd.Timestamp('20180101'), 'D' :...
1552 просмотров

Предупреждение о агрегации Pandas с лямбда-выражениями (FutureWarning: использование dict с переименованием устарело)
Мой вопрос похож на этот , однако мне нужно переименовать столбцы, потому что я агрегирую свои данные с помощью функций: def series(x): return ','.join(str(item) for item in x) agg = { 'revenue': ['sum', series], 'roi': ['sum',...
666 просмотров
schedule 08.07.2023

Разделение списков столбцов в Pandas DataFrame
Я ищу хороший способ решить следующую проблему. Мое текущее исправление не особенно чистое, и я надеюсь извлечь уроки из вашего понимания. Предположим, у меня есть Panda DataFrame, записи которого выглядят так: >>>...
161 просмотров

pandas groupby данные временных рядов в соответствии с результатом функции
Я анализирую данные временных рядов энергосистем и пытаюсь найти непрерывные точки данных, которые выходят за пределы определенного порогового значения. В настоящее время я использую формулу excel построчно, чтобы сделать это вручную, но когда я...
134 просмотров
schedule 03.06.2023

Как сгруппировать фрейм данных, чтобы получить подсчет по двум ключам в Python, используя groupby() в функции
у меня есть набор данных, который выглядит так: yg = pd.DataFrame({'grade': ['a','a','b','b','a'], 'key2': ['one','two','one','two','one'], 'year': (2012,2013,2012,2012,2013), 'id':...
37 просмотров
schedule 20.09.2022

Используется groupby для выбора самых последних данных, хотите добавить столбец, который возвращает дату данных
Изначально у меня был кадр данных, который выглядел так: industry population %of rural land country date Australia 2017-01-01 NaN NaN NaN...
80 просмотров
schedule 13.12.2023