So berechnen sie die standardabweichung bei pandas: mit beispielen
Sie können die Funktion DataFrame.std() verwenden, um die Standardabweichung von Werten in einem Pandas-DataFrame zu berechnen.
Zur Berechnung der Standardabweichung können Sie in der Praxis folgende Methoden nutzen:
Methode 1: Berechnen Sie die Standardabweichung einer Spalte
df [ ' column_name ' ] . std ( )
Methode 2: Berechnen Sie die Standardabweichung mehrerer Spalten
df [[ ' column_name1 ', ' column_name2 '] ] . std ( )
Methode 3: Berechnen Sie die Standardabweichung aller numerischen Spalten
df . std ( )
Beachten Sie, dass die Funktion std() bei der Berechnung der Standardabweichung automatisch alle NaN-Werte im DataFrame ignoriert.
Die folgenden Beispiele zeigen, wie jede Methode mit dem folgenden Pandas DataFrame verwendet wird:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'B', 'B', 'B', 'B', 'C', 'C'], ' points ': [25, 12, 15, 14, 19, 23, 25, 29], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #view DataFrame print (df) team points assists rebounds 0 to 25 5 11 1 to 12 7 8 2 B 15 7 10 3 B 14 9 6 4 B 19 12 6 5 B 23 9 5 6 C 25 9 9 7 C 29 4 12
Methode 1: Berechnen Sie die Standardabweichung einer Spalte
Der folgende Code zeigt, wie die Standardabweichung einer Spalte im DataFrame berechnet wird:
#calculate standard deviation of 'points' column df [ ' points ' ] . std ( ) 6.158617655657106
Die Standardabweichung beträgt 6,1586 .
Methode 2: Berechnen Sie die Standardabweichung mehrerer Spalten
Der folgende Code zeigt, wie die Standardabweichung mehrerer Spalten im DataFrame berechnet wird:
#calculate standard deviation of 'points' and 'rebounds' columns
df[[' points ', ' rebounds ']]. std ()
points 6.158618
rebounds 2.559994
dtype:float64
Die Standardabweichung der Spalte „Punkte“ beträgt 6,1586 und die Standardabweichung der Spalte „Rebounds“ beträgt 2,5599 .
Methode 3: Berechnen Sie die Standardabweichung aller numerischen Spalten
Der folgende Code zeigt, wie die Standardabweichung jeder numerischen Spalte im DataFrame berechnet wird:
#calculate standard deviation of all numeric columns
df. std ()
points 6.158618
assists 2.549510
rebounds 2.559994
dtype:float64
Beachten Sie, dass Pandas die Standardabweichung der Spalte „Team“ nicht berechnet hat, da es sich nicht um eine numerische Spalte handelte.
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie andere gängige Vorgänge in Pandas ausgeführt werden:
So berechnen Sie den Durchschnitt der Spalten in Pandas
So berechnen Sie den Spaltenmedian in Pandas
So berechnen Sie den Maximalwert von Spalten in Pandas