La guida completa: test di ipotesi in r


Un test di ipotesi è un test statistico formale che utilizziamo per rifiutare o non riuscire a rifiutare un’ipotesi statistica.

Questo tutorial spiega come eseguire i seguenti test di ipotesi in R:

  • Un test t del campione
  • Test T a due campioni
  • Test t per campioni accoppiati

Possiamo usare la funzione t.test() in R per eseguire ogni tipo di test:

 #one sample t-test
t. test (x, y = NULL,
       alternative = c(" two.sided ", " less ", " greater "),
       mu = 0, paired = FALSE, var.equal = FALSE ,
       conf.level = 0.95, …)

Oro:

  • x, y: i due campioni di dati.
  • alternativa: l’ipotesi alternativa del test.
  • mu: il vero valore della media.
  • appaiato: se eseguire o meno un t-test per appaiati.
  • var.equal: se assumere che le varianze siano uguali tra i campioni.
  • conf.level: il livello di confidenza da utilizzare.

I seguenti esempi mostrano come utilizzare questa funzione nella pratica.

Esempio 1: test t per un campione in R

Un test t su un campione viene utilizzato per verificare se la media di una popolazione è uguale o meno a un determinato valore.

Ad esempio, supponiamo di voler sapere se il peso medio di una determinata specie di tartaruga è o meno di 310 libbre. Usciamo e raccogliamo un semplice campione casuale di tartarughe con i seguenti pesi:

Peso : 300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303

Il codice seguente mostra come eseguire questo esempio di test t in R:

 #define vector of turtle weights
turtle_weights <- c(300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303)

#perform one sample t-test
t. test (x=turtle_weights,mu=310)

	One Sample t-test

data: turtle_weights
t = -1.5848, df = 12, p-value = 0.139
alternative hypothesis: true mean is not equal to 310
95 percent confidence interval:
 303.4236 311.0379
sample estimates:
mean of x 
 307.2308

Dal risultato possiamo vedere:

  • Statistica del test t: -1,5848
  • gradi di libertà: 12
  • valore p: 0,139
  • Intervallo di confidenza al 95% per la media vera: [303,4236, 311,0379]
  • peso medio delle tartarughe: 307.230

Poiché il valore p del test (0,139) non è inferiore a 0,05, non riusciamo a rifiutare l’ipotesi nulla.

Ciò significa che non abbiamo prove sufficienti per affermare che il peso medio di questa specie di tartaruga sia diverso da 310 libbre.

Esempio 2: test t a due campioni in R

Un t-test a due campioni viene utilizzato per verificare se le medie di due popolazioni sono uguali o meno.

Ad esempio, supponiamo di voler sapere se il peso medio di due diverse specie di tartarughe è uguale o meno. Per verificarlo, raccogliamo un semplice campione casuale di tartarughe di ciascuna specie con i seguenti pesi:

Campione 1 : 300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303

Campione 2 : 335, 329, 322, 321, 324, 319, 304, 308, 305, 311, 307, 300, 305

Il codice seguente mostra come eseguire questi due esempi di test t in R:

 #define vector of turtle weights for each sample
sample1 <- c(300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303)
sample2 <- c(335, 329, 322, 321, 324, 319, 304, 308, 305, 311, 307, 300, 305)

#perform two sample t-tests
t. test (x = sample1, y = sample2)

	Welch Two Sample t-test

data: sample1 and sample2
t = -2.1009, df = 19.112, p-value = 0.04914
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -14.73862953 -0.03060124
sample estimates:
mean of x mean of y 
 307.2308 314.6154

Dal risultato possiamo vedere:

  • Statistica del test t: -2,1009
  • gradi di libertà: 19.112
  • valore p: 0,04914
  • Intervallo di confidenza al 95% per la differenza media reale: [-14,74, -0,03]
  • peso medio del campione 1: 307.2308
  • peso medio del campione 2: 314,6154

Poiché il valore p del test (0,04914) è inferiore a 0,05, rifiutiamo l’ipotesi nulla.

Ciò significa che abbiamo prove sufficienti per affermare che il peso medio tra le due specie non è uguale.

Esempio 3: test t per campioni accoppiati in R

Un test t per campioni accoppiati viene utilizzato per confrontare le medie di due campioni quando ciascuna osservazione in un campione può essere associata a un’osservazione nell’altro campione.

Ad esempio, supponiamo di voler sapere se un determinato programma di allenamento è in grado o meno di aumentare il salto verticale massimo (in pollici) dei giocatori di basket.

Per verificarlo, possiamo reclutare un semplice campione casuale di 12 giocatori di basket universitari e misurare ciascuno dei loro salti verticali massimi. Successivamente possiamo far utilizzare a ciascun giocatore il programma di allenamento per un mese e poi misurare nuovamente il salto verticale massimo alla fine del mese.

I seguenti dati mostrano l’altezza massima del salto (in pollici) prima e dopo l’utilizzo del programma di allenamento per ciascun giocatore:

Anteriore : 22, 24, 20, 19, 19, 20, 22, 25, 24, 23, 22, 21

Dopo : 23, 25, 20, 24, 18, 22, 23, 28, 24, 25, 24, 20

Il codice seguente mostra come eseguire questo test t per campioni accoppiati in R:

 #define before and after max jump heights
before <- c(22, 24, 20, 19, 19, 20, 22, 25, 24, 23, 22, 21)
after <- c(23, 25, 20, 24, 18, 22, 23, 28, 24, 25, 24, 20)

#perform paired samples t-test
t. test (x = before, y = after, paired = TRUE )

	Paired t-test

data: before and after
t = -2.5289, df = 11, p-value = 0.02803
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -2.3379151 -0.1620849
sample estimates:
mean of the differences 
                  -1.25

Dal risultato possiamo vedere:

  • Statistica del test t: -2,5289
  • gradi di libertà: 11
  • valore p: 0,02803
  • Intervallo di confidenza al 95% per la differenza media reale: [-2,34, -0,16]
  • differenza media tra prima e dopo: -1,25

Poiché il valore p del test (0,02803) è inferiore a 0,05, rifiutiamo l’ipotesi nulla.

Ciò significa che abbiamo prove sufficienti per affermare che l’altezza media del salto prima e dopo l’utilizzo del programma di allenamento non è uguale.

Risorse addizionali

Utilizza i seguenti calcolatori online per eseguire automaticamente vari test t:

Un esempio di calcolatore del test t
Calcolatore del test t a due campioni
Calcolatore t-Test per campioni accoppiati

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *