Quando utilizzare s/sqrt(n) nelle statistiche


Nelle statistiche, incontrerai la formula s/√ n in diversi scenari.

Questa formula viene utilizzata per calcolare l’errore standard di una media campionaria.

Nella formula, s rappresenta la deviazione standard del campione e n rappresenta la dimensione del campione.

Questa formula appare nel calcolo di due test statistici:

1. Un test t del campione

2. Intervallo di confidenza per la media della popolazione

Gli esempi seguenti mostrano come utilizzare s/√ n in questi due scenari.

Esempio 1: utilizzo di s / sqrt(n) in un t-test a campione

Un test t su un campione viene utilizzato per verificare se la media di una popolazione è uguale o meno a un determinato valore.

Usiamo la seguente formula per calcolare la statistica del test t:

t = ( X – μ) / (s/ √n )

Oro:

  • x : mezzi campione
  • μ 0 : media ipotetica della popolazione
  • s: deviazione standard campionaria
  • n: dimensione del campione

Ad esempio, supponiamo di voler verificare se il peso medio delle tartarughe in una data popolazione è pari o meno a 300 libbre.

Raccogliamo un semplice campione casuale di tartarughe con le seguenti informazioni:

  • Dimensione del campione n = 40
  • Peso medio del campione x = 300
  • Deviazione standard del campione s = 18,5

Effettueremo il t-test per un campione con le seguenti ipotesi:

  • H 0 : μ = 310 (la media della popolazione è pari a 310 libri)
  • H A : μ ≠ 310 (la media della popolazione non è uguale a 310 libbre)

Innanzitutto, calcoleremo la statistica del test:

t = ( x – μ) / (s/ √n ) = (300-310) / (18,5/ √40 ) = -3,4187

Secondo il calcolatore del punteggio T per il valore P , il valore p associato a t = -3,4817 e gradi di libertà = n-1 = 40-1 = 39 è 0,00149.

Poiché questo valore p è inferiore a 0,05, rifiutiamo l’ipotesi nulla. Abbiamo prove sufficienti per affermare che il peso medio di questa specie di tartaruga non è pari a 310 libbre.

Esempio 2: utilizzo di s / sqrt(n) in un intervallo di confidenza per la media della popolazione

Un intervallo di confidenza per la media della popolazione è un intervallo di valori che probabilmente contiene la media della popolazione con un certo livello di confidenza.

Usiamo la seguente formula per calcolare un intervallo di confidenza per una media:

Intervallo di confidenza = x +/- t n-1, 1-α/2 *(s/√ n )

Oro:

  • x : mezzi campione
  • t: il valore t-critico
  • s: deviazione standard campionaria
  • n: dimensione del campione

Ad esempio, supponiamo di voler calcolare un intervallo di confidenza per il peso medio reale delle tartarughe in una determinata popolazione.

Raccogliamo un semplice campione casuale di tartarughe con le seguenti informazioni:

  • Dimensione del campione n = 40
  • Peso medio del campione x = 300
  • Deviazione standard del campione s = 18,5

Possiamo utilizzare la seguente formula per calcolare un intervallo di confidenza del 95% per il peso medio reale della popolazione di tartarughe:

  • IC al 95% = x +/- t n-1, 1-α/2 *(s/√ n )
  • IC al 95% = 300 +/- (2,022691) * (18,5/√ 40 )
  • IC al 95% = [294.083, 305.917]

L’intervallo di confidenza del 95% per il peso medio reale della popolazione di tartarughe è compreso tra 294.083 libbre e 305.917 libbre.

Risorse addizionali

I seguenti tutorial spiegano come calcolare un errore standard di una media in diversi software:

Come calcolare l’errore standard della media in Excel
Come calcolare l’errore standard della media in R
Come calcolare l’errore standard della media in Python

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *