Jak dodać kolumnę liczbową do ramki danych pandas


Możesz użyć następującej podstawowej składni, aby dodać kolumnę „count” do ramki DataFrame pandy:

 df[' var1_count '] = df. groupby (' var1 ')[' var1 ']. transform (' count ')

Ta konkretna składnia dodaje kolumnę o nazwie var1_count do DataFrame, która zawiera liczbę wartości w kolumnie o nazwie var1 .

Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce.

Przykład: Dodaj kolumnę liczbową w Pandach

Załóżmy, że mamy następującą ramkę danych pand, która zawiera informacje o różnych koszykarzach:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'],
                   ' pos ': ['Gu', 'Fo', 'Fo', 'Fo', 'Gu', 'Gu', 'Fo', 'Fo'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28]})

#view DataFrame
print (df)

  team pos points
0 A Gu 18
1 A Fo 22
2 A Fo 19
3 B Fo 14
4 B Gu 14
5 B Gu 11
6 B Fo 20
7 B Fo 28

Możemy użyć poniższego kodu, aby dodać kolumnę o nazwie team_count , która zawiera liczbę każdego zespołu:

 #add column that shows total count of each team
df[' team_count '] = df. groupby (' team ')[' team ']. transform (' count ')

#view updated DataFrame
print (df)

  team pos points team_count
0 A Gu 18 3
1 A Fo 22 3
2 A Fo 19 3
3 B Fo 14 5
4 B Gu 14 5
5 B Gu 11 5
6 B Fo 20 5
7 B Fo 28 5

Istnieją 3 linie o wartości zespołu A i 5 linii o wartości zespołu B.

Więc:

  • Dla każdego wiersza, w którym zespół równa się A, wartość w kolumnie team_count wynosi 3 .
  • Dla każdego wiersza, w którym drużyna równa się B, wartość w kolumnie team_count wynosi 5 .

Możesz także dodać kolumnę „konto”, która grupuje kilka zmiennych.

Na przykład poniższy kod pokazuje, jak dodać kolumnę „count”, która grupuje zmienne zespołu i pozycji :

 #add column that shows total count of each team and position
df[' team_pos_count '] = df. groupby ([' team ', ' pos ')[' team ']. transform (' count ')

#view updated DataFrame
print (df)

  team pos points team_pos_count
0 A Gu 18 1
1 A Fo 22 2
2 A Fo 19 2
3 B Fo 14 3
4 B Gu 14 2
5 B Gu 11 2
6 B Fo 20 3
7 B Fo 28 3

Z wyniku możemy zobaczyć:

  • Jest 1 wiersz, który zawiera A w kolumnie zespołu i Gu w kolumnie poz .
  • Istnieją 2 wiersze zawierające A w kolumnie zespół i Fo w kolumnie poz .
  • Istnieją 3 wiersze zawierające B w kolumnie zespół i Fo w kolumnie poz .
  • Istnieją 2 wiersze zawierające B w kolumnie zespół i Gu w kolumnie poz .

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w pandach:

Pandy: Jak korzystać z GroupBy i liczenia wartości
Pandy: Jak korzystać z GroupBy z liczbą pojemników
Pandy: Jak liczyć wartości w kolumnie z warunkiem

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *