Come eseguire un test t a due campioni in r
Un t-test a due campioni viene utilizzato per verificare se le medie di due popolazioni sono uguali o meno.
È possibile utilizzare la seguente sintassi di base per eseguire un t-test di due esempi in R:
t. test (group1, group2, var. equal = TRUE )
Nota : specificando var.equal=TRUE , stiamo dicendo a R di presupporre che le varianze siano uguali tra i due campioni.
Se non vuoi fare questo presupposto, lascia semplicemente questo argomento da parte e R eseguirà invece il test t di Welch , che non presuppone che le varianze siano uguali tra i campioni.
L’esempio seguente mostra come eseguire nella pratica un t-test a due campioni in R.
Esempio: test T a due campioni in R
Supponiamo di voler sapere se due diverse specie di piante hanno la stessa altezza media.
Per verificarlo, raccogliamo un semplice campione casuale di 12 piante di ciascuna specie.
Il codice seguente mostra come eseguire un t-test a due campioni in R per determinare se l’altezza media è uguale tra le due specie:
#create vectors to hold plant heights from each sample group1 <- c(8, 8, 9, 9, 9, 11, 12, 13, 13, 14, 15, 19) group2 <- c(11, 12, 13, 13, 14, 14, 14, 15, 16, 18, 18, 19) #perform two sample t-tests t. test (group1, group2, var. equal = TRUE ) Two Sample t-test data: group1 and group2 t = -2.5505, df = 22, p-value = 0.01823 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -5.5904820 -0.5761847 sample estimates: mean of x mean of y 11.66667 14.75000
Ecco come interpretare i risultati del test:
dati: i nomi dei vettori che contengono i dati campione.
t: la statistica del test t. In questo caso è -2.5505 .
df : I gradi di libertà, calcolati come n 1 + n 2 – 2 = 12 + 12 – 2 = 22 .
Valore p: il valore p che corrisponde a una statistica del test di -2.5505 e df = 22. Il valore p risulta essere .01823 . Possiamo confermare questo valore utilizzando il calcolatore T Score to P Value .
Intervallo di confidenza al 95%: intervallo di confidenza al 95% per la vera differenza nelle medie tra i due gruppi. Risulta essere [-5.59, -.576] .
stime campionarie: la media campionaria di ciascun gruppo. In questo caso, la media campionaria per il Gruppo 1 era 11,667 e la media campionaria per il Gruppo 2 era 14,75 .
Le ipotesi nulla e alternativa per questo particolare t-test a due campioni sono le seguenti:
H 0 : µ 1 = µ 2 (le due medie della popolazione sono uguali)
H A : µ 1 ≠μ 2 (le due medie della popolazione non sono uguali)
Essendo il valore p del nostro test (0,01823) inferiore a 0,05, rifiutiamo l’ipotesi nulla.
Ciò significa che abbiamo prove sufficienti per concludere che l’altezza media delle piante tra le due specie non è uguale.
Note tecniche
La funzione t.test() in R utilizza la seguente sintassi:
t. test (x, y, alternative="two.sided", mu=0, paired=FALSE, var.equal=FALSE, conf.level=0.95)
Oro:
- x, y: i nomi dei due vettori che contengono i dati.
- alternativa: L’ipotesi alternativa. Le opzioni includono “fronte-retro”, “meno” o “più grande”.
- mu: il valore che si presume sia la vera differenza delle medie.
- appaiato: se utilizzare o meno un t-test appaiato.
- var.equal: se le differenze sono uguali o meno tra i due gruppi.
- conf.level: il livello di confidenza da utilizzare per il test.
Sentiti libero di modificare uno qualsiasi di questi argomenti quando esegui il tuo test t, a seconda del particolare test che desideri eseguire.
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre attività comuni in R:
Come eseguire un test T per un campione in R
Come eseguire il test T di Welch in R
Come eseguire un test t per campioni appaiati in R