So berechnen sie die standardabweichung bei pandas: mit beispielen

Von Dr. Benjamin Anderson Juli 23, 2023 Führung Keine Kommentare

Sie können die Funktion DataFrame.std() verwenden, um die Standardabweichung von Werten in einem Pandas-DataFrame zu berechnen.

Zur Berechnung der Standardabweichung können Sie in der Praxis folgende Methoden nutzen:

Methode 1: Berechnen Sie die Standardabweichung einer Spalte

 df [ ' column_name ' ] . std ( )

Methode 2: Berechnen Sie die Standardabweichung mehrerer Spalten

 df [[ ' column_name1 ', ' column_name2 '] ] . std ( )

Methode 3: Berechnen Sie die Standardabweichung aller numerischen Spalten

 df . std ( )

Beachten Sie, dass die Funktion std() bei der Berechnung der Standardabweichung automatisch alle NaN-Werte im DataFrame ignoriert.

Die folgenden Beispiele zeigen, wie jede Methode mit dem folgenden Pandas DataFrame verwendet wird:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'B', 'B', 'B', 'B', 'C', 'C'],
                   ' points ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
print (df)

	team points assists rebounds
0 to 25 5 11
1 to 12 7 8
2 B 15 7 10
3 B 14 9 6
4 B 19 12 6
5 B 23 9 5
6 C 25 9 9
7 C 29 4 12

Methode 1: Berechnen Sie die Standardabweichung einer Spalte

Der folgende Code zeigt, wie die Standardabweichung einer Spalte im DataFrame berechnet wird:

 #calculate standard deviation of 'points' column
df [ ' points ' ] . std ( )

6.158617655657106

Die Standardabweichung beträgt 6,1586 .

Methode 2: Berechnen Sie die Standardabweichung mehrerer Spalten

Der folgende Code zeigt, wie die Standardabweichung mehrerer Spalten im DataFrame berechnet wird:

 #calculate standard deviation of 'points' and 'rebounds' columns
df[[' points ', ' rebounds ']]. std ()

points 6.158618
rebounds 2.559994
dtype:float64

Die Standardabweichung der Spalte „Punkte“ beträgt 6,1586 und die Standardabweichung der Spalte „Rebounds“ beträgt 2,5599 .

Methode 3: Berechnen Sie die Standardabweichung aller numerischen Spalten

Der folgende Code zeigt, wie die Standardabweichung jeder numerischen Spalte im DataFrame berechnet wird:

 #calculate standard deviation of all numeric columns
df. std ()

points 6.158618
assists 2.549510
rebounds 2.559994
dtype:float64

Beachten Sie, dass Pandas die Standardabweichung der Spalte „Team“ nicht berechnet hat, da es sich nicht um eine numerische Spalte handelte.

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie andere gängige Vorgänge in Pandas ausgeführt werden:

So berechnen Sie den Durchschnitt der Spalten in Pandas
So berechnen Sie den Spaltenmedian in Pandas
So berechnen Sie den Maximalwert von Spalten in Pandas

Über den Autor

Dr. Benjamin Anderson

Hallo, ich bin Benjamin, ein pensionierter Statistikprofessor, der sich zum engagierten Statorials-Lehrer entwickelt hat. Mit umfassender Erfahrung und Fachwissen auf dem Gebiet der Statistik bin ich bestrebt, mein Wissen zu teilen, um Studenten durch Statorials zu befähigen. Mehr wissen