Hoe u een getalkolom toevoegt aan een pandas dataframe


U kunt de volgende basissyntaxis gebruiken om een kolom ‚count‘ toe te voegen aan een Panda’s DataFrame:

 df[' var1_count '] = df. groupby (' var1 ')[' var1 ']. transform (' count ')

Deze specifieke syntaxis voegt een kolom met de naam var1_count toe aan het DataFrame, dat het aantal waarden bevat in de kolom met de naam var1 .

Het volgende voorbeeld laat zien hoe u deze syntaxis in de praktijk kunt gebruiken.

Voorbeeld: Voeg een cijferkolom toe in Panda’s

Stel dat we het volgende panda’s DataFrame hebben dat informatie bevat over verschillende basketbalspelers:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'],
                   ' pos ': ['Gu', 'Fo', 'Fo', 'Fo', 'Gu', 'Gu', 'Fo', 'Fo'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28]})

#view DataFrame
print (df)

  team pos points
0 A Gu 18
1 A Fo 22
2 A Fo 19
3 B Fo 14
4 B Gu 14
5 B Gu 11
6 B Fo 20
7 B Fo 28

We kunnen de volgende code gebruiken om een kolom toe te voegen met de naam team_count , die het aantal van elk team bevat:

 #add column that shows total count of each team
df[' team_count '] = df. groupby (' team ')[' team ']. transform (' count ')

#view updated DataFrame
print (df)

  team pos points team_count
0 A Gu 18 3
1 A Fo 22 3
2 A Fo 19 3
3 B Fo 14 5
4 B Gu 14 5
5 B Gu 11 5
6 B Fo 20 5
7 B Fo 28 5

Er zijn 3 lijnen met een teamwaarde van A en 5 lijnen met een teamwaarde van B.

Dus:

  • Voor elke rij waarin team gelijk is aan A, is de waarde in de kolom team_count 3 .
  • Voor elke rij waarin team gelijk is aan B, is de waarde in de kolom team_count 5 .

U kunt ook een kolom ‚account‘ toevoegen waarin verschillende variabelen zijn gegroepeerd.

De volgende code laat bijvoorbeeld zien hoe u een kolom ‚aantal‘ kunt toevoegen waarin de team- en pos- variabelen zijn gegroepeerd:

 #add column that shows total count of each team and position
df[' team_pos_count '] = df. groupby ([' team ', ' pos ')[' team ']. transform (' count ')

#view updated DataFrame
print (df)

  team pos points team_pos_count
0 A Gu 18 1
1 A Fo 22 2
2 A Fo 19 2
3 B Fo 14 3
4 B Gu 14 2
5 B Gu 11 2
6 B Fo 20 3
7 B Fo 28 3

Uit het resultaat kunnen we zien:

  • Er is 1 rij met A in de teamkolom en Gu in de pos- kolom.
  • Er zijn 2 rijen met A in de teamkolom en Fo in de pos- kolom.
  • Er zijn 3 rijen met B in de teamkolom en Fo in de pos- kolom.
  • Er zijn 2 rijen met B in de teamkolom en Gu in de pos- kolom.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in panda’s kunt uitvoeren:

Panda’s: GroupBy gebruiken en waardetellingen
Panda’s: GroupBy gebruiken met het aantal bakken
Panda’s: waarden tellen in een kolom met voorwaarde

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert