Hoe de standaardafwijking van een lijst in python te berekenen
U kunt een van de volgende drie methoden gebruiken om de standaardafwijking van een lijst in Python te berekenen:
Methode 1: Gebruik de NumPy-bibliotheek
import numpy as np #calculate standard deviation of list n.p. std ( my_list )
Methode 2: Gebruik de statistiekenbibliotheek
import statistics as stat #calculate standard deviation of list stat. stdev ( my_list )
Methode 3: Gebruik een aangepaste formule
#calculate standard deviation of list st. stdev ( my_list )
De volgende voorbeelden laten zien hoe u elk van deze methoden in de praktijk kunt gebruiken.
Methode 1: Bereken de standaardafwijking met behulp van de NumPy-bibliotheek
De volgende code laat zien hoe u zowel de standaarddeviatie van de steekproef als de standaarddeviatie van de populatie van een lijst kunt berekenen met NumPy:
import numpy as np #define list my_list = [3, 5, 5, 6, 7, 8, 13, 14, 14, 17, 18] #calculate sample standard deviation of list n.p. std ( my_list, ddof= 1 ) 5.310367218940701 #calculate population standard deviation of list n.p. std ( my_list ) 5.063236478416116
Merk op dat de standaarddeviatie van de populatie altijd kleiner zal zijn dan de standaarddeviatie van de steekproef voor een bepaalde gegevensset.
Methode 2: Bereken de standaarddeviatie met behulp van de statistiekenbibliotheek
De volgende code laat zien hoe u zowel de standaarddeviatie van de steekproef als de standaarddeviatie van de populatie van een lijst kunt berekenen met behulp van de Python-statistiekenbibliotheek:
import statistics as stat #define list my_list = [3, 5, 5, 6, 7, 8, 13, 14, 14, 17, 18] #calculate sample standard deviation of list stat. stdev (my_list) 5.310367218940701 #calculate population standard deviation of list stat. pstdev (my_list) 5.063236478416116
Methode 3: Bereken de standaardafwijking met behulp van een aangepaste formule
De volgende code laat zien hoe u zowel de standaarddeviatie van de steekproef als de standaarddeviatie van de populatie van een lijst kunt berekenen zonder Python-bibliotheken te importeren:
#define list my_list = [3, 5, 5, 6, 7, 8, 13, 14, 14, 17, 18] #calculate sample standard deviation of list (sum((x-(sum(my_list) / len(my_list))) ** 2 for x in my_list) / (len(my_list)-1)) ** 0.5 5.310367218940701 #calculate population standard deviation of list (sum((x-(sum(my_list) / len(my_list))) ** 2 for x in my_list) / len(my_list)) ** 0.5 5.063236478416116
Merk op dat alle drie de methoden dezelfde waarden berekenden voor de standaardafwijking van de lijst.
Aanvullende bronnen
Hoe de standaardfout van het gemiddelde in Python te berekenen
Hoe de gemiddelde kwadratische fout (MSE) in Python te berekenen