Jak obliczyć błąd standardowy średniej w r


Błąd standardowy średniej to sposób pomiaru rozkładu wartości w zbiorze danych. Oblicza się go w następujący sposób:

Błąd standardowy = s / √n

Złoto:

  • s : odchylenie standardowe próbki
  • n : wielkość próbki

W tym samouczku wyjaśniono dwie metody, których można użyć do obliczenia błędu standardowego zbioru danych w języku R.

Metoda 1: Użyj biblioteki Plotrix

Pierwszym sposobem obliczenia błędu standardowego średniej jest użycie wbudowanej funkcji std.error() biblioteki Plotrix.

Poniższy kod pokazuje, jak używać tej funkcji:

 library (plotrix)

#define dataset
data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29)

#calculate standard error of the mean 
std.error(data)

2.001447

Okazuje się, że błąd standardowy średniej wynosi 2,001447 .

Metoda 2: Zdefiniuj własną funkcję

Innym sposobem obliczenia błędu standardowego średniej zbioru danych jest po prostu zdefiniowanie własnej funkcji.

Poniższy kod pokazuje, jak to zrobić:

 #define standard error of mean function
std.error <- function (x) sd(x)/sqrt( length (x))

#define dataset
data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29)

#calculate standard error of the mean 
std.error(data)

2.001447

Ponownie okazuje się, że błąd standardowy średniej wynosi 2,0014 .

Jak interpretować błąd standardowy średniej

Błąd standardowy średniej jest po prostu miarą rozrzutu wartości wokół średniej.

Interpretując błąd standardowy średniej, należy pamiętać o dwóch rzeczach:

1. Im większy błąd standardowy średniej, tym bardziej rozproszone są wartości wokół średniej w zbiorze danych.

Aby to zilustrować, zastanówmy się, czy nie zmienimy ostatniej wartości poprzedniego zbioru danych o znacznie większą liczbę:

 #define dataset
data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 150)

#calculate standard error of the mean 
std.error(data)

6.978265

Zwróć uwagę, jak błąd standardowy wzrasta z 2,001447 do 6,978265 .

Oznacza to, że wartości w tym zbiorze danych są bardziej rozłożone wokół średniej w porównaniu z poprzednim zbiorem danych.

2. Wraz ze wzrostem liczebności próby błąd standardowy średniej ma tendencję do zmniejszania się.

Aby to zilustrować, rozważ błąd standardowy średniej dla następujących dwóch zestawów danych:

 #define first dataset and find SEM
data1 <- c(1, 2, 3, 4, 5)
std.error(data1)

0.7071068

#define second dataset and find SEM
data2 <- c(1, 2, 3, 4, 5, 1, 2, 3, 4, 5)
std.error(data2)

0.4714045

Drugi zestaw danych to po prostu pierwszy zestaw danych powtórzony dwukrotnie.

Zatem oba zbiory danych mają tę samą średnią, ale drugi zbiór danych ma większą próbkę i dlatego ma mniejszy błąd standardowy.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w języku R:

Jak obliczyć wariancję próby i populacji w R
Jak obliczyć łączną wariancję w R
Jak obliczyć współczynnik zmienności R

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *