Pandy: jak utworzyć tabelę przestawną z liczbą wartości


Możesz użyć dowolnej z poniższych metod, aby utworzyć tabelę przestawną w pandach, która wyświetla liczbę wartości w określonych kolumnach:

Metoda 1: Tabela przestawna z liczbami

 p.d. pivot_table (df, values=' col1 ', index=' col2 ', columns=' col3 ',
               aggfunc=' count ')

Metoda 2: Tabela przestawna z unikalnymi liczbami

 p.d. pivot_table (df, values=' col1 ', index=' col2 ', columns=' col3 ',
               aggfunc=pd. Series . nunique )

Poniższe przykłady pokazują, jak używać każdej metody z następującą ramką DataFrame pand:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' position ': ['G', 'G', 'F', 'C', 'G', 'F', 'F', 'F'],
                   ' points ': [4, 4, 6, 8, 9, 5, 5, 12]})

#view DataFrame
df

	team position points
0 A G 4
1 A G 4
2 A F 6
3 A C 8
4 B G 9
5 B F 5
6 B F 5
7 B F 12

Metoda 1: Utwórz tabelę przestawną Pandy z liczbami

Poniższy kod pokazuje, jak utworzyć tabelę przestawną w pandach, która wyświetla całkowitą liczbę wartości „punktowych” dla każdego „zespołu” i „pozycji” w DataFrame:

 #create pivot table
df_pivot = pd. pivot_table (df, values=' points ', index=' team ', columns=' position ',
                          aggfunc=' count ')

#view pivot table
df_pivot

position C F G
team			
   A 1.0 1.0 2.0
   B NaN 3.0 1.0

Z wyniku możemy zobaczyć:

  • W kolumnie „punkty” znajduje się 1 wartość dla drużyny A na pozycji C.
  • W kolumnie „punkty” znajduje się 1 wartość dla drużyny A na pozycji F.
  • W kolumnie „punkty” znajdują się 2 wartości dla drużyny A na pozycji G.

I tak dalej.

Metoda 2: Utwórz tabelę przestawną Pandy z unikalnymi liczbami

Poniższy kod pokazuje, jak utworzyć tabelę przestawną w pandach, która wyświetla unikalną całkowitą liczbę wartości „punktowych” dla każdego „zespołu” i „pozycji” w DataFrame:

 #create pivot table
df_pivot = pd. pivot_table (df, values=' points ', index=' team ', columns=' position ',
                          aggfunc=pd. Series . nunique )

#view pivot table
df_pivot

position C F G
team			
   A 1.0 1.0 1.0
   B NaN 2.0 1.0

Z wyniku możemy zobaczyć:

  • W kolumnie „punkty” znajduje się 1 unikalna wartość dla drużyny A na pozycji C.
  • W kolumnie „punkty” znajduje się 1 unikalna wartość dla drużyny A na pozycji F.
  • W kolumnie „punkty” znajduje się 1 unikalna wartość dla drużyny A na pozycji G.

I tak dalej.

Uwaga : pełną dokumentację funkcji obrotowej pandy() można znaleźć tutaj .

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe operacje na pandach:

Pandy: Jak zmienić kształt DataFrame z długiej na szeroką
Pandy: Jak zmienić kształt ramki danych z szerokiej na długą
Pandy: jak grupować i agregować w wielu kolumnach

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *