Pandy: utwórz tabelę przestawną z wieloma funkcjami aggfunc


Możesz użyć poniższej składni, aby utworzyć tabelę przestawną w pandach i podać wiele wartości argumentowi aggfunc :

 df. pivot_table (index=' col1 ', values=' col2 ', aggfunc=(' sum ', ' mean '))

Ten konkretny przykład tworzy tabelę przestawną, która wyświetla sumę i średnią wartości w col2 , pogrupowanych według col1 .

Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce.

Przykład: utwórz tabelę przestawną Pandy z wieloma funkcjami aggfunc

Załóżmy, że mamy następującą ramkę danych pand, która zawiera informacje o różnych koszykarzach:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B',
                            'B', 'B', 'C', 'C', 'C', 'C'],
                   ' points ': [4, 4, 2, 8, 9, 5, 5, 7, 8, 8, 4, 3],
                   ' assists ': [2, 2, 5, 5, 4, 7, 5, 3, 9, 8, 4, 4]})

#view DataFrame
print (df)

   team points assists
0 to 4 2
1 to 4 2
2 to 2 5
3 to 8 5
4 B 9 4
5 B 5 7
6 B 5 5
7 B 7 3
8 C 8 9
9 C 8 8
10 C 4 4
11 C 3 4

Możemy użyć poniższego kodu, aby utworzyć tabelę przestawną podsumowującą zarówno sumę, jak i średnią liczbę punktów zdobytych przez każdą drużynę :

 #create pivot table to summarize sum and mean of points by team
df. pivot_table (index=' team ', values=' points ', aggfunc=(' sum ', ' mean '))

	mean sum
team		
At 4.50 18
B 6.50 26
C 5.75 23

Powstała tabela przestawna podsumowuje średnią i sumę punktów zdobytych przez każdy zespół.

Na przykład możemy zobaczyć:

  • Zawodnicy drużyny A uzyskali średnią wartość punktową 4,50 , a łączną wartość punktową 18 .
  • Zawodnicy drużyny B uzyskali średnią wartość punktową 6,50 , a łączną wartość punktową 26 .
  • Gracze drużyny C uzyskali średnią wartość punktową 5,75 , a łączną wartość punktową 23 .

Należy pamiętać, że w tym przykładzie agregowaliśmy przy użyciu sumy i średniej, ale możemy również agregować według innych wskaźników, takich jak:

  • liczyć
  • min
  • maksymalny
  • mediana
  • std (odchylenie standardowe)

Poniższy przykład pokazuje, jak agregować wartości kolumn punktów na podstawie tych wskaźników dla każdego zespołu:

 #create pivot table to summarize several metrics for points by team
df. pivot_table (index=' team ', values=' points ',
               aggfunc=(' count ', ' min ', ' max ', ' median ', ' std '))

        count max median min std
team					
A 4 8 4.0 2 2.516611
B 4 9 6.0 5 1.914854
C 4 8 6.0 3 2.629956

Uwaga : pełną dokumentację funkcji obrotowej pandy() można znaleźć tutaj .

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania związane z pandą:

Pandy: Jak sortować tabelę przestawną według wartości w kolumnie
Pandy: Jak utworzyć tabelę przestawną z sumą wartości
Pandy: Jak dodać sumy częściowe do tabeli przestawnej
Pandy: Jak zmienić nazwy kolumn w tabeli przestawnej

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *