So ermitteln sie die summe der zeilen in einem pandas dataframe


Oftmals könnte es für Sie von Interesse sein, die Summe einer oder mehrerer Zeilen in einem Pandas-DataFrame zu berechnen. Glücklicherweise können Sie dies in Pandas problemlos mit der Funktion sum(axis=1) tun.

Dieses Tutorial zeigt mehrere Beispiele für die Verwendung dieser Funktion im folgenden DataFrame:

 import pandas as pd
import numpy as np

#createDataFrame
df = pd.DataFrame({'rating': [90, 85, 82, 88, 94, 90, 76, 75, 87, 86],
                   'points': [25, 20, 14, 16, 27, 20, 12, 15, 14, 19],
                   'assists': [5, 7, 7, 8, 5, 7, 6, 9, 9, 5],
                   'rebounds': [8, np.nan, 10, 6, 6, 9, 6, 10, 10, 7]})

#view DataFrame 
df


        rating points assists rebounds
0 90 25 5 8.0
1 85 20 7 NaN
2 82 14 7 10.0
3 88 16 8 6.0
4 94 27 5 6.0
5 90 20 7 9.0
6 76 12 6 6.0
7 75 15 9 10.0
8 87 14 9 10.0
9 86 19 5 7.07

Beispiel 1: Ermitteln Sie die Summe jeder Zeile

Mit der folgenden Syntax können wir die Summe jeder Zeile des DataFrame ermitteln:

 df. sum (axis=1)

0 128.0
1,112.0
2,113.0
3 118.0
4,132.0
5,126.0
6 100.0
7 109.0
8 120.0
9 117.0
dtype:float64

Die Ausgabe sagt uns:

  • Die Summe der Werte in der ersten Zeile beträgt 128 .
  • Die Summe der Werte in der zweiten Zeile beträgt 112 .
  • Die Summe der Werte in der dritten Zeile beträgt 113 .

Und so weiter.

Beispiel 2: Zeilensummen in eine neue Spalte einfügen

Mit dem folgenden Code können wir unserem DataFrame eine Spalte hinzufügen, die die Zeilensummen enthält:

 #define new DataFrame column 'row_sum' as the sum of each row
df['row_sum'] = df. sum (axis=1)

#view DataFrame
df

rating points assists rebounds row_sum
0 90 25 5 8.0 128.0
1 85 20 7 NaN 112.0
2 82 14 7 10.0 113.0
3 88 16 8 6.0 118.0
4 94 27 5 6.0 132.0
5 90 20 7 9.0 126.0
6 76 12 6 6.0 100.0
7 75 15 9 10.0 109.0
8 87 14 9 10.0 120.0
9 86 19 5 7.0 117.0

Beispiel 3: Zeilensummen für eine kurze Liste bestimmter Spalten finden

Mit dem folgenden Code können wir die Zeilensumme für eine kurze Liste bestimmter Spalten ermitteln:

 #define new DataFrame column as sum of points and assists columns
df['sum_pa'] = df['points'] + df['assists']

#view DataFrame
df

	rating points assists rebounds sum_pa
0 90 25 5 8.0 30
1 85 20 7 NaN 27
2 82 14 7 10.0 21
3 88 16 8 6.0 24
4 94 27 5 6.0 32
5 90 20 7 9.0 27
6 76 12 6 6.0 18
7 75 15 9 10.0 24
8 87 14 9 10.0 23
9 86 19 5 7.0 24

Beispiel 4: Zeilensummen für eine lange Liste spezifischer Spalten finden

Mit dem folgenden Code können wir die Zeilensumme für eine längere Liste spezifischer Spalten ermitteln:

 #define col_list as a list of all DataFrame column names
col_list=list(df)

#remove the column 'rating' from the list
col_list.remove('rating')

#define new DataFrame column as sum of rows in col_list 
df['new_sum'] = df[col_list]. sum (axis=1)

#view DataFrame
df

        rating points assists rebounds new_sum
0 90 25 5 8.0 38.0
1 85 20 7 NaN 27.0
2 82 14 7 10.0 31.0
3 88 16 8 6.0 30.0
4 94 27 5 6.0 38.0
5 90 20 7 9.0 36.0
6 76 12 6 6.0 24.0
7 75 15 9 10.0 34.0
8 87 14 9 10.0 33.0
9 86 19 5 7.0 31.0

Die vollständige Dokumentation der Pandas-Funktion sum() finden Sie hier .

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert