Come calcolare l'errore standard della media in r


L’ errore standard della media è un modo per misurare la distribuzione dei valori in un set di dati. Viene calcolato come segue:

Errore standard = s / √n

Oro:

  • s : deviazione standard campionaria
  • n : dimensione del campione

Questo tutorial spiega due metodi che puoi utilizzare per calcolare l’errore standard di un set di dati in R.

Metodo 1: utilizzare la libreria Plotrix

Il primo modo per calcolare l’errore standard della media è utilizzare la funzione std.error() incorporata della libreria Plotrix.

Il codice seguente mostra come utilizzare questa funzione:

 library (plotrix)

#define dataset
data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29)

#calculate standard error of the mean 
std.error(data)

2.001447

L’errore standard della media risulta essere 2.001447 .

Metodo 2: Definisci la tua funzione

Un altro modo per calcolare l’errore standard della media di un set di dati è semplicemente definire la propria funzione.

Il codice seguente mostra come eseguire questa operazione:

 #define standard error of mean function
std.error <- function (x) sd(x)/sqrt( length (x))

#define dataset
data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29)

#calculate standard error of the mean 
std.error(data)

2.001447

Ancora una volta, l’errore standard della media risulta essere 2.0014 .

Come interpretare l’errore standard della media

L’errore standard della media è semplicemente una misura della diffusione dei valori attorno alla media.

Ci sono due cose da tenere a mente quando si interpreta l’errore standard della media:

1. Quanto maggiore è l’errore standard della media, tanto più sparsi sono i valori attorno alla media in un set di dati.

Per illustrare ciò, considera se modifichiamo l’ultimo valore del set di dati precedente con un numero molto maggiore:

 #define dataset
data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 150)

#calculate standard error of the mean 
std.error(data)

6.978265

Nota come l’errore standard aumenta da 2.001447 a 6.978265 .

Ciò indica che i valori in questo set di dati sono più distribuiti attorno alla media rispetto al set di dati precedente.

2. All’aumentare della dimensione del campione, l’errore standard della media tende a diminuire.

Per illustrare ciò, si consideri l’errore standard della media per i seguenti due insiemi di dati:

 #define first dataset and find SEM
data1 <- c(1, 2, 3, 4, 5)
std.error(data1)

0.7071068

#define second dataset and find SEM
data2 <- c(1, 2, 3, 4, 5, 1, 2, 3, 4, 5)
std.error(data2)

0.4714045

Il secondo set di dati è semplicemente il primo set di dati ripetuto due volte.

Quindi entrambi i set di dati hanno la stessa media, ma il secondo set di dati ha una dimensione campionaria maggiore e quindi ha un errore standard più piccolo.

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre attività comuni in R:

Come calcolare la varianza del campione e della popolazione in R
Come calcolare la varianza aggregata in R
Come calcolare il coefficiente di variazione di R

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *