So berechnen sie mittelwert, median und modus in pandas
Sie können die folgenden Funktionen verwenden, um den Mittelwert, den Median und den Modus jeder numerischen Spalte in einem Pandas-DataFrame zu berechnen:
print ( df.mean (numeric_only= True )) print (df. median (numeric_only= True )) print (df. mode (numeric_only= True ))
Das folgende Beispiel zeigt, wie Sie diese Funktionen in der Praxis nutzen können.
Beispiel: Berechnen Sie Mittelwert, Median und Modus in Pandas
Angenommen, wir haben den folgenden Pandas-DataFrame, der Informationen über die von verschiedenen Basketballspielern in vier verschiedenen Spielen erzielten Punkte enthält:
import pandas as pd #createDataFrame df = pd. DataFrame ({' player ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'], ' game1 ': [18, 22, 19, 14, 14, 11, 20, 28], ' game2 ': [5, 7, 7, 9, 12, 9, 9, 4], ' game3 ': [11, 8, 10, 6, 6, 5, 9, 12], ' game4 ': [9, 8, 10, 9, 14, 15, 10, 11]}) #view DataFrame print (df) player game1 game2 game3 game4 0 A 18 5 11 9 1 B 22 7 8 8 2 C 19 7 10 10 3 D 14 9 6 9 4 E 14 12 6 14 5 F 11 9 5 15 6 G 20 9 9 10 7:28 4 12 11
Wir können die folgende Syntax verwenden, um den Durchschnittswert jeder numerischen Spalte zu berechnen:
#calculate mean of each numeric column print ( df.mean (numeric_only= True )) game1 18,250 game2 7,750 game3 8.375 game4 10,750 dtype:float64
Aus dem Ergebnis können wir sehen:
- Der Durchschnittswert in der Spalte „Spiel1“ beträgt 18,25 .
- Der Durchschnittswert in der Spalte „Spiel2“ beträgt 7,75 .
- Der Durchschnittswert in der Spalte game3 beträgt 8,375 .
- Der Durchschnittswert in der Spalte game4 beträgt 10,75 .
Anschließend können wir die folgende Syntax verwenden, um den Medianwert jeder numerischen Spalte zu berechnen:
#calculate median of each numeric column print (df. median (numeric_only= True )) game1 18.5 game2 8.0 game3 8.5 game4 10.0 dtype:float64
Aus dem Ergebnis können wir sehen:
- Der Medianwert in der Spalte spiel1 beträgt 18,5 .
- Der Medianwert in der Spalte „game2“ beträgt 8 .
- Der Medianwert in der Spalte game3 beträgt 8,5 .
- Der Medianwert in der Spalte „game4“ beträgt 10 .
Anschließend können wir die folgende Syntax verwenden, um den Modus jeder numerischen Spalte zu berechnen:
#calculate mode of each numeric column print (df. mode (numeric_only= True )) game1 game2 game3 game4 0 14.0 9.0 6.0 9 1 NaN NaN NaN 10
Aus dem Ergebnis können wir sehen:
- Der Modus in der Spalte game1 ist 14 .
- Der Modus in der Spalte game2 ist 9 .
- Der Modus in der Spalte game3 ist 6 .
- Der Modus in der Spalte „Spiel 4“ ist 9 und 10
Beachten Sie, dass die Spalte „game4“ zwei Modi hatte, da in dieser Spalte zwei Werte am häufigsten vorkamen.
Hinweis : Sie können auch die Funktion discover() in Pandas verwenden, um aussagekräftigere Statistiken für jede Spalte zu generieren.
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie andere gängige Vorgänge in Pandas ausgeführt werden:
So berechnen Sie den Gruppendurchschnitt bei Pandas
So berechnen Sie den Gruppenmedian bei Pandas
So berechnen Sie den Modus nach Gruppe in Pandas