So berechnen sie den standardfehler des mittelwerts in python


Der Standardfehler des Mittelwerts ist eine Möglichkeit, die Verteilung von Werten in einem Datensatz zu messen. Es wird wie folgt berechnet:

Standardfehler des Mittelwerts = s / √n

Gold:

  • s : Stichprobenstandardabweichung
  • n : Stichprobengröße

In diesem Tutorial werden zwei Methoden erläutert, mit denen Sie den Standardfehler des Mittelwerts eines Datensatzes in Python berechnen können. Beachten Sie, dass beide Methoden genau die gleichen Ergebnisse liefern.

Methode 1: Verwenden Sie SciPy

Die erste Möglichkeit, den Standardfehler des Mittelwerts zu berechnen, ist die Verwendung der Funktion sem() aus der SciPy Stats-Bibliothek.

Der folgende Code zeigt, wie diese Funktion verwendet wird:

 from scipy. stats import week

#define dataset 
data = [3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29]

#calculate standard error of the mean 
sem(data)

2.001447

Der Standardfehler des Mittelwerts beträgt 2,001447 .

Methode 2: Verwenden Sie NumPy

Eine andere Möglichkeit, den Standardfehler des Mittelwerts eines Datensatzes zu berechnen, ist die Verwendung der std() -Funktion von NumPy.

Beachten Sie, dass wir im Argument dieser Funktion ddof=1 angeben müssen, um die Stichprobenstandardabweichung im Gegensatz zur Populationsstandardabweichung zu berechnen.

Der folgende Code zeigt, wie das geht:

 import numpy as np

#define dataset
data = np.array([3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29])

#calculate standard error of the mean 
n.p. std (data, ddof= 1 ) / np. sqrt ( np.size (data))

2.001447

Auch hier beträgt der Standardfehler des Mittelwerts 2,001447 .

So interpretieren Sie den Standardfehler des Mittelwerts

Der Standardfehler des Mittelwerts ist einfach ein Maß für die Streuung der Werte um den Mittelwert. Bei der Interpretation des Standardfehlers des Mittelwerts sind zwei Dinge zu beachten:

1. Je größer der Standardfehler des Mittelwerts ist, desto stärker streuen die Werte in einem Datensatz um den Mittelwert.

Um dies zu veranschaulichen, stellen wir uns vor, wir würden den letzten Wert des vorherigen Datensatzes um eine viel größere Zahl ändern:

 from scipy. stats import week

#define dataset 
data = [3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 150 ]

#calculate standard error of the mean 
sem(data)

6.978265

Beachten Sie, wie der Standardfehler von 2,001447 auf 6,978265 ansteigt. Dies weist darauf hin, dass die Werte in diesem Datensatz im Vergleich zum vorherigen Datensatz stärker um den Mittelwert verteilt sind.

2. Mit zunehmender Stichprobengröße nimmt der Standardfehler des Mittelwerts tendenziell ab.

Um dies zu veranschaulichen, betrachten Sie den Standardfehler des Mittelwerts für die folgenden zwei Datensätze:

 from scipy . stats import week 

#define first dataset and find SEM
data1 = [1, 2, 3, 4, 5]
sem(data1)

0.7071068

#define second dataset and find SEM
data2 = [1, 2, 3, 4, 5, 1, 2, 3, 4, 5]
sem(data2)

0.4714045

Der zweite Datensatz ist einfach der erste Datensatz, der zweimal wiederholt wird. Beide Datensätze haben also den gleichen Mittelwert, aber der zweite Datensatz hat eine größere Stichprobengröße und daher einen kleineren Standardfehler.

Zusätzliche Ressourcen

So berechnen Sie den Standardfehler des Mittelwerts in R
So berechnen Sie den Standardfehler des Mittelwerts in Excel
So berechnen Sie den Standardfehler des Mittelwerts in Google Sheets

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert