So berechnen sie mittelwert, median und modus in pandas


Sie können die folgenden Funktionen verwenden, um den Mittelwert, den Median und den Modus jeder numerischen Spalte in einem Pandas-DataFrame zu berechnen:

 print ( df.mean (numeric_only= True ))
print (df. median (numeric_only= True ))
print (df. mode (numeric_only= True ))

Das folgende Beispiel zeigt, wie Sie diese Funktionen in der Praxis nutzen können.

Beispiel: Berechnen Sie Mittelwert, Median und Modus in Pandas

Angenommen, wir haben den folgenden Pandas-DataFrame, der Informationen über die von verschiedenen Basketballspielern in vier verschiedenen Spielen erzielten Punkte enthält:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' player ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' game1 ': [18, 22, 19, 14, 14, 11, 20, 28],
                   ' game2 ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' game3 ': [11, 8, 10, 6, 6, 5, 9, 12],
                   ' game4 ': [9, 8, 10, 9, 14, 15, 10, 11]})
                   
#view DataFrame
print (df)

  player game1 game2 game3 game4
0 A 18 5 11 9
1 B 22 7 8 8
2 C 19 7 10 10
3 D 14 9 6 9
4 E 14 12 6 14
5 F 11 9 5 15
6 G 20 9 9 10
7:28 4 12 11

Wir können die folgende Syntax verwenden, um den Durchschnittswert jeder numerischen Spalte zu berechnen:

 #calculate mean of each numeric column
print ( df.mean (numeric_only= True ))

game1 18,250
game2 7,750
game3 8.375
game4 10,750
dtype:float64

Aus dem Ergebnis können wir sehen:

  • Der Durchschnittswert in der Spalte „Spiel1“ beträgt 18,25 .
  • Der Durchschnittswert in der Spalte „Spiel2“ beträgt 7,75 .
  • Der Durchschnittswert in der Spalte game3 beträgt 8,375 .
  • Der Durchschnittswert in der Spalte game4 beträgt 10,75 .

Anschließend können wir die folgende Syntax verwenden, um den Medianwert jeder numerischen Spalte zu berechnen:

 #calculate median of each numeric column
print (df. median (numeric_only= True ))

game1 18.5
game2 8.0
game3 8.5
game4 10.0
dtype:float64

Aus dem Ergebnis können wir sehen:

  • Der Medianwert in der Spalte spiel1 beträgt 18,5 .
  • Der Medianwert in der Spalte „game2“ beträgt 8 .
  • Der Medianwert in der Spalte game3 beträgt 8,5 .
  • Der Medianwert in der Spalte „game4“ beträgt 10 .

Anschließend können wir die folgende Syntax verwenden, um den Modus jeder numerischen Spalte zu berechnen:

 #calculate mode of each numeric column
print (df. mode (numeric_only= True ))

   game1 game2 game3 game4
0 14.0 9.0 6.0 9
1 NaN NaN NaN 10

Aus dem Ergebnis können wir sehen:

  • Der Modus in der Spalte game1 ist 14 .
  • Der Modus in der Spalte game2 ist 9 .
  • Der Modus in der Spalte game3 ist 6 .
  • Der Modus in der Spalte „Spiel 4“ ist 9 und 10

Beachten Sie, dass die Spalte „game4“ zwei Modi hatte, da in dieser Spalte zwei Werte am häufigsten vorkamen.

Hinweis : Sie können auch die Funktion discover() in Pandas verwenden, um aussagekräftigere Statistiken für jede Spalte zu generieren.

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie andere gängige Vorgänge in Pandas ausgeführt werden:

So berechnen Sie den Gruppendurchschnitt bei Pandas
So berechnen Sie den Gruppenmedian bei Pandas
So berechnen Sie den Modus nach Gruppe in Pandas

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert