Hoe de standaardafwijking in panda's te berekenen: met voorbeelden


U kunt de functie DataFrame.std() gebruiken om de standaardafwijking van waarden in een Panda DataFrame te berekenen.

U kunt de volgende methoden gebruiken om de standaardafwijking in de praktijk te berekenen:

Methode 1: Bereken de standaardafwijking van een kolom

 df [ ' column_name ' ] . std ( )

Methode 2: Bereken de standaardafwijking van meerdere kolommen

 df [[ ' column_name1 ', ' column_name2 '] ] . std ( )

Methode 3: Bereken de standaardafwijking van alle numerieke kolommen

 df . std ( )

Houd er rekening mee dat de functie std() automatisch alle NaN-waarden in het DataFrame negeert bij het berekenen van de standaardafwijking.

De volgende voorbeelden laten zien hoe u elke methode kunt gebruiken met de volgende panda’s DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'B', 'B', 'B', 'B', 'C', 'C'],
                   ' points ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
print (df)

	team points assists rebounds
0 to 25 5 11
1 to 12 7 8
2 B 15 7 10
3 B 14 9 6
4 B 19 12 6
5 B 23 9 5
6 C 25 9 9
7 C 29 4 12

Methode 1: Bereken de standaardafwijking van een kolom

De volgende code laat zien hoe u de standaardafwijking van een kolom in het DataFrame berekent:

 #calculate standard deviation of 'points' column
df [ ' points ' ] . std ( )

6.158617655657106

De standaarddeviatie blijkt 6,1586 te zijn.

Methode 2: Bereken de standaardafwijking van meerdere kolommen

De volgende code laat zien hoe u de standaardafwijking van meerdere kolommen in het DataFrame berekent:

 #calculate standard deviation of 'points' and 'rebounds' columns
df[[' points ', ' rebounds ']]. std ()

points 6.158618
rebounds 2.559994
dtype:float64

De standaardafwijking van de kolom “punten” is 6,1586 en de standaardafwijking van de kolom “rebounds” is 2,5599 .

Methode 3: Bereken de standaardafwijking van alle numerieke kolommen

De volgende code laat zien hoe u de standaardafwijking van elke numerieke kolom in het DataFrame berekent:

 #calculate standard deviation of all numeric columns
df. std ()

points 6.158618
assists 2.549510
rebounds 2.559994
dtype:float64

Merk op dat panda’s de standaardafwijking van de kolom ‚team‘ niet hebben berekend, aangezien deze geen numerieke kolom was.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende bewerkingen in panda’s kunt uitvoeren:

Hoe het gemiddelde van kolommen in Panda’s te berekenen
Hoe de kolommediaan in Panda’s te berekenen
Hoe de maximale waarde van kolommen in Panda’s te berekenen

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert