Come calcolare l'errore standard della media in r
L’ errore standard della media è un modo per misurare la distribuzione dei valori in un set di dati. Viene calcolato come segue:
Errore standard = s / √n
Oro:
- s : deviazione standard campionaria
- n : dimensione del campione
Questo tutorial spiega due metodi che puoi utilizzare per calcolare l’errore standard di un set di dati in R.
Metodo 1: utilizzare la libreria Plotrix
Il primo modo per calcolare l’errore standard della media è utilizzare la funzione std.error() incorporata della libreria Plotrix.
Il codice seguente mostra come utilizzare questa funzione:
library (plotrix) #define dataset data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29) #calculate standard error of the mean std.error(data) 2.001447
L’errore standard della media risulta essere 2.001447 .
Metodo 2: Definisci la tua funzione
Un altro modo per calcolare l’errore standard della media di un set di dati è semplicemente definire la propria funzione.
Il codice seguente mostra come eseguire questa operazione:
#define standard error of mean function std.error <- function (x) sd(x)/sqrt( length (x)) #define dataset data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29) #calculate standard error of the mean std.error(data) 2.001447
Ancora una volta, l’errore standard della media risulta essere 2.0014 .
Come interpretare l’errore standard della media
L’errore standard della media è semplicemente una misura della diffusione dei valori attorno alla media.
Ci sono due cose da tenere a mente quando si interpreta l’errore standard della media:
1. Quanto maggiore è l’errore standard della media, tanto più sparsi sono i valori attorno alla media in un set di dati.
Per illustrare ciò, considera se modifichiamo l’ultimo valore del set di dati precedente con un numero molto maggiore:
#define dataset data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 150) #calculate standard error of the mean std.error(data) 6.978265
Nota come l’errore standard aumenta da 2.001447 a 6.978265 .
Ciò indica che i valori in questo set di dati sono più distribuiti attorno alla media rispetto al set di dati precedente.
2. All’aumentare della dimensione del campione, l’errore standard della media tende a diminuire.
Per illustrare ciò, si consideri l’errore standard della media per i seguenti due insiemi di dati:
#define first dataset and find SEM data1 <- c(1, 2, 3, 4, 5) std.error(data1) 0.7071068 #define second dataset and find SEM data2 <- c(1, 2, 3, 4, 5, 1, 2, 3, 4, 5) std.error(data2) 0.4714045
Il secondo set di dati è semplicemente il primo set di dati ripetuto due volte.
Quindi entrambi i set di dati hanno la stessa media, ma il secondo set di dati ha una dimensione campionaria maggiore e quindi ha un errore standard più piccolo.
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre attività comuni in R:
Come calcolare la varianza del campione e della popolazione in R
Come calcolare la varianza aggregata in R
Come calcolare il coefficiente di variazione di R