Вопросы по теме 'pandas-groupby'
Python - функции прокрутки для объекта GroupBy
У меня есть объект временного ряда grouped типа <pandas.core.groupby.SeriesGroupBy object at 0x03F1A9F0> . grouped.sum() дает желаемый результат, но я не могу заставить Rolling_sum работать с объектом groupby . Есть ли способ применить...
87637 просмотров
schedule
08.11.2022
Лучший способ добавить групповые итоги в фрейм данных в Pandas
У меня есть простая задача, и мне интересно, есть ли лучший/более эффективный способ сделать это. У меня есть кадр данных, который выглядит так:
Group Score Count
0 A 5 100
1 A 1 50
2 A 3 5
3 B...
5700 просмотров
schedule
26.11.2022
Pandas Groupy берет только первые N групп
У меня есть DataFrame, который я хочу сгруппировать по идентификатору, например. грамм.:
import pandas as pd
df = pd.DataFrame({'item_id': ['a', 'a', 'b', 'b', 'b', 'c', 'd'], 'user_id': [1,2,1,1,3,1,5]})
print df
Что генерирует:...
16489 просмотров
schedule
27.02.2023
reset_index () в исходные индексы столбцов после группы pandas ()?
Я создаю сгруппированный кадр данных df = df.groupby(['X','Y']).max() , который затем хочу записать (в csv, без индексов). Поэтому мне нужно преобразовать «X» и «Y» обратно в обычные столбцы; Я пытался использовать reset_index() , но порядок...
1849 просмотров
schedule
03.06.2022
Как получить доступ к столбцу MultiIndex после groupby в пандах?
В одноиндексированном фрейме данных столбцы доступны в группе по объектам:
df1 = pd.DataFrame({'a':[2,2,4,4], 'b': [5,6,7,8]})
df1.groupby('a')['b'].sum() ->
a
2 11
4 15
Но в кадре данных MultiIndex, когда он не группируется по...
2023 просмотров
schedule
16.10.2022
Pandas groupBy с условной группировкой
У меня есть два кадра данных, и мне нужно сгруппировать первый на основе некоторых критериев из второго df.
df1=
summary participant_id response_date
0 2.0 11 2016-04-30
1 3.0 11 2016-05-01
2...
250 просмотров
schedule
15.03.2024
groupby и возвращает все строки первых n групп
У меня есть кадр данных pandas, как показано ниже.
>>> df.head()
0 1 2 3 4 5 6
0 35000 26009 OPTIDX BANKNIFTY XX 1499351400 BANKNIFTY1770621000CE
1 35001 26009 OPTIDX...
1903 просмотров
schedule
19.08.2022
ValueError: невозможно переиндексировать с повторяющейся оси без повторяющихся значений оси
Я группирую кадр данных по годам (это один уровень мультииндекса по столбцам), применяя функцию, которая дополняет df до 11 столбцов (добавляя столько пустых столбцов, сколько необходимо), а затем возвращая мягкий дф. Но это вызывает ошибку....
2280 просмотров
schedule
22.02.2024
Как я могу вычислить абсолютную сумму с помощью группы в пандах?
Как я могу вычислить абсолютную сумму с помощью группы в пандах?
Например, учитывая DataFrame:
Player Score
0 A 100
1 B -150
2 A -110
3 B 180
4 B 125
Я хотел бы иметь общий счет для игрока А...
11606 просмотров
schedule
22.03.2023
Переиндексация Pandas для заполнения пропущенных дат или лучший метод для заполнения?
Мои данные - это записи об отсутствии с завода. В некоторые дни нет пропусков, поэтому для этого дня нет данных или даты. Однако, и там, где это становится неуместным с другими показанными примерами, в любой день может быть несколько отсутствий по...
1580 просмотров
schedule
18.02.2023
Как выполнить условный подсчет после groupby в кадре данных Pandas?
У меня есть следующий кадр данных:
key1 key2
0 a one
1 a two
2 b one
3 b two
4 a one
5 c two
Теперь я хочу сгруппировать фрейм данных по key1 и подсчитать столбец key2 со значением "one" , чтобы получить...
61601 просмотров
schedule
28.10.2022
Панды объединяют, масштабируют и поворачивают длинные и широкие кадры данных
У меня есть два кадра данных Pandas, которые мне нужно объединить. Первый представляет собой полный набор данных, содержащий мои продажные цены на товары с различными интервалами количества. Цены снижаются по мере увеличения количества приобретаемых...
264 просмотров
schedule
12.01.2024
Невозможно построить Pandas groupby данные точечной диаграммы и линейных графиков
Я пытаюсь построить серию сгруппированных по таблице 1 в виде точечной диаграммы с кадрами данных, сгруппированными по таблице 2, в виде линейных графиков, в которых все они представлены на одной диаграмме. Мне не удалось совместить их. Тем не...
804 просмотров
schedule
15.10.2023
Как получить непрерывный поминутный агрегат с пандами?
У меня есть таблица БД, содержащая столбец даты и времени со значениями, растянувшимися на 24 часа. Если я использую функцию группировки pandas dataframe groupby для минутной агрегации, это приведет к тому, что все будет разбито на 0-59 ведер...
107 просмотров
schedule
31.01.2023
как агрегировать только числовые столбцы в кадре данных смешанного типа dtypes
У меня смешанный pd.DataFrame :
import pandas as pd
import numpy as np
df = pd.DataFrame({ 'A' : 1.,
'B' : pd.Timestamp('20130102'),
'C' : pd.Timestamp('20180101'),
'D' :...
1552 просмотров
schedule
24.03.2023
Предупреждение о агрегации Pandas с лямбда-выражениями (FutureWarning: использование dict с переименованием устарело)
Мой вопрос похож на этот , однако мне нужно переименовать столбцы, потому что я агрегирую свои данные с помощью функций:
def series(x):
return ','.join(str(item) for item in x)
agg = {
'revenue': ['sum', series],
'roi': ['sum',...
666 просмотров
schedule
08.07.2023
Разделение списков столбцов в Pandas DataFrame
Я ищу хороший способ решить следующую проблему. Мое текущее исправление не особенно чистое, и я надеюсь извлечь уроки из вашего понимания.
Предположим, у меня есть Panda DataFrame, записи которого выглядят так:
>>>...
161 просмотров
schedule
23.03.2024
pandas groupby данные временных рядов в соответствии с результатом функции
Я анализирую данные временных рядов энергосистем и пытаюсь найти непрерывные точки данных, которые выходят за пределы определенного порогового значения.
В настоящее время я использую формулу excel построчно, чтобы сделать это вручную, но когда я...
134 просмотров
schedule
03.06.2023
Как сгруппировать фрейм данных, чтобы получить подсчет по двум ключам в Python, используя groupby() в функции
у меня есть набор данных, который выглядит так:
yg = pd.DataFrame({'grade': ['a','a','b','b','a'],
'key2': ['one','two','one','two','one'],
'year': (2012,2013,2012,2012,2013),
'id':...
37 просмотров
schedule
20.09.2022
Используется groupby для выбора самых последних данных, хотите добавить столбец, который возвращает дату данных
Изначально у меня был кадр данных, который выглядел так:
industry population %of rural land
country date
Australia 2017-01-01 NaN NaN NaN...
80 просмотров
schedule
13.12.2023