Как я могу вычислить абсолютную сумму с помощью группы в пандах?

Как я могу вычислить абсолютную сумму с помощью группы в пандах?

Например, учитывая DataFrame:

    Player  Score
0      A    100
1      B   -150
2      A   -110
3      B    180
4      B    125

Я хотел бы иметь общий счет для игрока А (100+110=210), а также общий счет для игрока А (150+180+125=455), игнорируя знак счета.

Я могу использовать следующий код для вычисления суммы:

import pandas as pd
import numpy as np

frame = pd.DataFrame({'Player' : ['A', 'B', 'A', 'B', 'B'], 
                      'Score'  : [100, -150, -110, 180, 125]})

print('frame: {0}'.format(frame))

total_scores = frame[['Player','Score']].groupby(['Player']).agg(['sum'])

print('total_scores: {0}'.format(total_scores))

но как я могу вычислить абсолютную сумму с помощью группы?

frame[['Player','Score']].abs().groupby(['Player']).agg(['sum']) неудивительно возвращает:

Traceback (most recent call last):
  File "O:\tests\absolute_count.py", line 10, in <module>
    total_scores = frame[['Player','Score']].abs().groupby(['Player']).agg(['sum'])
  File "C:\Users\dernoncourt\AppData\Local\Continuum\Anaconda3\lib\site-packages\pandas\core\generic.py", line 5518, in abs
    return np.abs(self)
TypeError: bad operand type for abs(): 'str'

Я не хочу изменять DataFrame.


person Franck Dernoncourt    schedule 30.07.2017    source источник


Ответы (2)


Вы можете применить функцию, которая принимает абсолютное значение, а затем суммирует его:

>>> frame.groupby('Player').Score.apply(lambda c: c.abs().sum())
Player
A    210
B    455
Name: Score, dtype: int64

Вы также можете создать новый столбец с абсолютными значениями, а затем суммировать это:

>>> frame.assign(AbsScore=frame.Score.abs()).groupby('Player').AbsScore.sum()
Player
A    210
B    455
Name: AbsScore, dtype: int64
person BrenBarn    schedule 30.07.2017

Вы можете использовать DataFrameGroupBy.apply с лямбдой:

In [326]: df.groupby('Player').Score.apply(lambda x: np.sum(np.abs(x)))
Out[326]: 
Player
A    210
B    455
Name: Score, dtype: int64

Чтобы вернуть столбец Player, используйте df.reset_index:

In [371]: df.groupby('Player').Score.apply(lambda x: np.sum(np.abs(x))).reset_index()
Out[371]: 
  Player  Score
0      A    210
1      B    455
person cs95    schedule 30.07.2017