Guida completa: come interpretare i risultati del t-test in r
Un t-test a due campioni viene utilizzato per verificare se le medie di due popolazioni sono uguali o meno.
Questo tutorial fornisce una guida completa su come interpretare i risultati di un t-test a due campioni in R.
Passaggio 1: creare i dati
Supponiamo di voler sapere se due diverse specie di piante hanno la stessa altezza media. Per verificarlo, raccogliamo un semplice campione casuale di 12 piante di ciascuna specie.
#create vector of plant heights from group 1 group1 <- c(8, 8, 9, 9, 9, 11, 12, 13, 13, 14, 15, 19) #create vector of plant heights from group 2 group2 <- c(11, 12, 13, 13, 14, 14, 14, 15, 16, 18, 18, 19)
Passaggio 2: eseguire e interpretare il test t a due campioni
Successivamente, utilizzeremo il comando t.test() per eseguire un t-test di due esempi:
#perform two sample t-tests t. test (group1, group2) Welch Two Sample t-test data: group1 and group2 t = -2.5505, df = 20.488, p-value = 0.01884 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -5.6012568 -0.5654098 sample estimates: mean of x mean of y 11.66667 14.75000
Ecco come interpretare i risultati del test:
dati: ci dice i dati che sono stati utilizzati nel t-test a due campioni. In questo caso abbiamo utilizzato i vettori chiamati group1 e group2.
t: questa è la statistica del test t. In questo caso è -2.5505 .
df : questi sono i gradi di libertà associati alla statistica t-test. In questo caso è 20.488 . Fare riferimento all’approssimazione di Satterthwaire per una spiegazione su come viene calcolato questo valore dei gradi di libertà.
Valore p: questo è il valore p che corrisponde a una statistica del test di -2,5505 e df = 20,488. Il valore p risulta essere .01884 . Possiamo confermare questo valore utilizzando il calcolatore T Score to P Value .
ipotesi alternativa: ci dice l’ipotesi alternativa utilizzata per questo particolare t-test. In questo caso, l’ipotesi alternativa è che la vera differenza nelle medie tra i due gruppi non sia uguale a zero.
Intervallo di confidenza al 95%: ci dice l’intervallo di confidenza al 95% per la vera differenza nelle medie tra i due gruppi. Risulta essere [-5.601, -.5654] .
stime campionarie: ci dice la media campionaria di ciascun gruppo. In questo caso, la media campionaria per il Gruppo 1 era 11,667 e la media campionaria per il Gruppo 2 era 14,75 .
Le due ipotesi per questo particolare t-test a due campioni sono:
H 0 : µ 1 = µ 2 (le due medie della popolazione sono uguali)
H A : µ 1 ≠μ 2 (le due medie della popolazione non sono uguali)
Poiché il valore p del nostro test (0,01884) è inferiore a alfa = 0,05, rifiutiamo l’ipotesi nulla del test. Ciò significa che abbiamo prove sufficienti per affermare che l’altezza media delle piante tra le due popolazioni è diversa.
Commenti
La funzione t.test() in R utilizza la seguente sintassi:
t.test(x, y, alternativa = “due lati”, mu = 0, accoppiato = FALSO, var.equal = FALSO, conf.level = 0.95)
Oro:
- x, y: i nomi dei due vettori che contengono i dati.
- alternativa: L’ipotesi alternativa. Le opzioni includono “fronte-retro”, “meno” o “più grande”.
- mu: il valore che si presume sia la vera differenza delle medie.
- appaiato: se utilizzare o meno un t-test appaiato.
- var.equal: se le differenze sono uguali o meno tra i due gruppi.
- conf.level: il livello di confidenza da utilizzare per il test.
Nel nostro esempio sopra, abbiamo utilizzato le seguenti ipotesi:
- Abbiamo utilizzato un’ipotesi alternativa bilaterale.
- Abbiamo testato se la vera differenza nelle medie fosse pari o meno a zero.
- Abbiamo utilizzato un test t a due campioni, non un test t appaiato.
- Non abbiamo dato per scontato che le differenze fossero uguali tra i gruppi.
- Abbiamo utilizzato un livello di confidenza del 95%.
Sentiti libero di modificare uno qualsiasi di questi argomenti quando esegui il tuo t-test, a seconda del particolare test che desideri eseguire.
Risorse addizionali
Un’introduzione al test t a due campioni
Calcolatore del test t a due campioni