So berechnen sie den standardfehler des mittelwerts in python
Der Standardfehler des Mittelwerts ist eine Möglichkeit, die Verteilung von Werten in einem Datensatz zu messen. Es wird wie folgt berechnet:
Standardfehler des Mittelwerts = s / √n
Gold:
- s : Stichprobenstandardabweichung
- n : Stichprobengröße
In diesem Tutorial werden zwei Methoden erläutert, mit denen Sie den Standardfehler des Mittelwerts eines Datensatzes in Python berechnen können. Beachten Sie, dass beide Methoden genau die gleichen Ergebnisse liefern.
Methode 1: Verwenden Sie SciPy
Die erste Möglichkeit, den Standardfehler des Mittelwerts zu berechnen, ist die Verwendung der Funktion sem() aus der SciPy Stats-Bibliothek.
Der folgende Code zeigt, wie diese Funktion verwendet wird:
from scipy. stats import week #define dataset data = [3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29] #calculate standard error of the mean sem(data) 2.001447
Der Standardfehler des Mittelwerts beträgt 2,001447 .
Methode 2: Verwenden Sie NumPy
Eine andere Möglichkeit, den Standardfehler des Mittelwerts eines Datensatzes zu berechnen, ist die Verwendung der std() -Funktion von NumPy.
Beachten Sie, dass wir im Argument dieser Funktion ddof=1 angeben müssen, um die Stichprobenstandardabweichung im Gegensatz zur Populationsstandardabweichung zu berechnen.
Der folgende Code zeigt, wie das geht:
import numpy as np #define dataset data = np.array([3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29]) #calculate standard error of the mean n.p. std (data, ddof= 1 ) / np. sqrt ( np.size (data)) 2.001447
Auch hier beträgt der Standardfehler des Mittelwerts 2,001447 .
So interpretieren Sie den Standardfehler des Mittelwerts
Der Standardfehler des Mittelwerts ist einfach ein Maß für die Streuung der Werte um den Mittelwert. Bei der Interpretation des Standardfehlers des Mittelwerts sind zwei Dinge zu beachten:
1. Je größer der Standardfehler des Mittelwerts ist, desto stärker streuen die Werte in einem Datensatz um den Mittelwert.
Um dies zu veranschaulichen, stellen wir uns vor, wir würden den letzten Wert des vorherigen Datensatzes um eine viel größere Zahl ändern:
from scipy. stats import week #define dataset data = [3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 150 ] #calculate standard error of the mean sem(data) 6.978265
Beachten Sie, wie der Standardfehler von 2,001447 auf 6,978265 ansteigt. Dies weist darauf hin, dass die Werte in diesem Datensatz im Vergleich zum vorherigen Datensatz stärker um den Mittelwert verteilt sind.
2. Mit zunehmender Stichprobengröße nimmt der Standardfehler des Mittelwerts tendenziell ab.
Um dies zu veranschaulichen, betrachten Sie den Standardfehler des Mittelwerts für die folgenden zwei Datensätze:
from scipy . stats import week #define first dataset and find SEM data1 = [1, 2, 3, 4, 5] sem(data1) 0.7071068 #define second dataset and find SEM data2 = [1, 2, 3, 4, 5, 1, 2, 3, 4, 5] sem(data2) 0.4714045
Der zweite Datensatz ist einfach der erste Datensatz, der zweimal wiederholt wird. Beide Datensätze haben also den gleichen Mittelwert, aber der zweite Datensatz hat eine größere Stichprobengröße und daher einen kleineren Standardfehler.
Zusätzliche Ressourcen
So berechnen Sie den Standardfehler des Mittelwerts in R
So berechnen Sie den Standardfehler des Mittelwerts in Excel
So berechnen Sie den Standardfehler des Mittelwerts in Google Sheets