Hoe de standaardafwijking in panda's te berekenen: met voorbeelden
U kunt de functie DataFrame.std() gebruiken om de standaardafwijking van waarden in een Panda DataFrame te berekenen.
U kunt de volgende methoden gebruiken om de standaardafwijking in de praktijk te berekenen:
Methode 1: Bereken de standaardafwijking van een kolom
df [ ' column_name ' ] . std ( )
Methode 2: Bereken de standaardafwijking van meerdere kolommen
df [[ ' column_name1 ', ' column_name2 '] ] . std ( )
Methode 3: Bereken de standaardafwijking van alle numerieke kolommen
df . std ( )
Houd er rekening mee dat de functie std() automatisch alle NaN-waarden in het DataFrame negeert bij het berekenen van de standaardafwijking.
De volgende voorbeelden laten zien hoe u elke methode kunt gebruiken met de volgende panda’s DataFrame:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'B', 'B', 'B', 'B', 'C', 'C'], ' points ': [25, 12, 15, 14, 19, 23, 25, 29], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #view DataFrame print (df) team points assists rebounds 0 to 25 5 11 1 to 12 7 8 2 B 15 7 10 3 B 14 9 6 4 B 19 12 6 5 B 23 9 5 6 C 25 9 9 7 C 29 4 12
Methode 1: Bereken de standaardafwijking van een kolom
De volgende code laat zien hoe u de standaardafwijking van een kolom in het DataFrame berekent:
#calculate standard deviation of 'points' column df [ ' points ' ] . std ( ) 6.158617655657106
De standaarddeviatie blijkt 6,1586 te zijn.
Methode 2: Bereken de standaardafwijking van meerdere kolommen
De volgende code laat zien hoe u de standaardafwijking van meerdere kolommen in het DataFrame berekent:
#calculate standard deviation of 'points' and 'rebounds' columns
df[[' points ', ' rebounds ']]. std ()
points 6.158618
rebounds 2.559994
dtype:float64
De standaardafwijking van de kolom “punten” is 6,1586 en de standaardafwijking van de kolom “rebounds” is 2,5599 .
Methode 3: Bereken de standaardafwijking van alle numerieke kolommen
De volgende code laat zien hoe u de standaardafwijking van elke numerieke kolom in het DataFrame berekent:
#calculate standard deviation of all numeric columns
df. std ()
points 6.158618
assists 2.549510
rebounds 2.559994
dtype:float64
Merk op dat panda’s de standaardafwijking van de kolom ‚team‘ niet hebben berekend, aangezien deze geen numerieke kolom was.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende bewerkingen in panda’s kunt uitvoeren:
Hoe het gemiddelde van kolommen in Panda’s te berekenen
Hoe de kolommediaan in Panda’s te berekenen
Hoe de maximale waarde van kolommen in Panda’s te berekenen