Jak obliczyć błąd standardowy średniej w r
Błąd standardowy średniej to sposób pomiaru rozkładu wartości w zbiorze danych. Oblicza się go w następujący sposób:
Błąd standardowy = s / √n
Złoto:
- s : odchylenie standardowe próbki
- n : wielkość próbki
W tym samouczku wyjaśniono dwie metody, których można użyć do obliczenia błędu standardowego zbioru danych w języku R.
Metoda 1: Użyj biblioteki Plotrix
Pierwszym sposobem obliczenia błędu standardowego średniej jest użycie wbudowanej funkcji std.error() biblioteki Plotrix.
Poniższy kod pokazuje, jak używać tej funkcji:
library (plotrix) #define dataset data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29) #calculate standard error of the mean std.error(data) 2.001447
Okazuje się, że błąd standardowy średniej wynosi 2,001447 .
Metoda 2: Zdefiniuj własną funkcję
Innym sposobem obliczenia błędu standardowego średniej zbioru danych jest po prostu zdefiniowanie własnej funkcji.
Poniższy kod pokazuje, jak to zrobić:
#define standard error of mean function std.error <- function (x) sd(x)/sqrt( length (x)) #define dataset data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29) #calculate standard error of the mean std.error(data) 2.001447
Ponownie okazuje się, że błąd standardowy średniej wynosi 2,0014 .
Jak interpretować błąd standardowy średniej
Błąd standardowy średniej jest po prostu miarą rozrzutu wartości wokół średniej.
Interpretując błąd standardowy średniej, należy pamiętać o dwóch rzeczach:
1. Im większy błąd standardowy średniej, tym bardziej rozproszone są wartości wokół średniej w zbiorze danych.
Aby to zilustrować, zastanówmy się, czy nie zmienimy ostatniej wartości poprzedniego zbioru danych o znacznie większą liczbę:
#define dataset data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 150) #calculate standard error of the mean std.error(data) 6.978265
Zwróć uwagę, jak błąd standardowy wzrasta z 2,001447 do 6,978265 .
Oznacza to, że wartości w tym zbiorze danych są bardziej rozłożone wokół średniej w porównaniu z poprzednim zbiorem danych.
2. Wraz ze wzrostem liczebności próby błąd standardowy średniej ma tendencję do zmniejszania się.
Aby to zilustrować, rozważ błąd standardowy średniej dla następujących dwóch zestawów danych:
#define first dataset and find SEM data1 <- c(1, 2, 3, 4, 5) std.error(data1) 0.7071068 #define second dataset and find SEM data2 <- c(1, 2, 3, 4, 5, 1, 2, 3, 4, 5) std.error(data2) 0.4714045
Drugi zestaw danych to po prostu pierwszy zestaw danych powtórzony dwukrotnie.
Zatem oba zbiory danych mają tę samą średnią, ale drugi zbiór danych ma większą próbkę i dlatego ma mniejszy błąd standardowy.
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w języku R:
Jak obliczyć wariancję próby i populacji w R
Jak obliczyć łączną wariancję w R
Jak obliczyć współczynnik zmienności R