T-test a due campioni: definizione, formula ed esempio
Un t-test a due campioni viene utilizzato per determinare se le medie di due popolazioni sono uguali o meno.
Questo tutorial spiega quanto segue:
- La motivazione per eseguire un t-test a due campioni.
- La formula per eseguire un t-test a due campioni.
- Le ipotesi che devono essere soddisfatte per eseguire un t-test a due campioni.
- Un esempio di come eseguire un t-test su due campioni.
T-test a due campioni: motivazione
Supponiamo di voler sapere se il peso medio di due diverse specie di tartarughe è uguale o meno. Dato che ci sono migliaia di tartarughe in ogni popolazione, sarebbe troppo dispendioso in termini di tempo e denaro andare in giro e pesare ciascuna tartaruga individualmente.
Invece, potremmo prendere un semplice campione casuale di 15 tartarughe da ciascuna popolazione e utilizzare il peso medio di ciascun campione per determinare se il peso medio è uguale tra le due popolazioni:
Tuttavia, è praticamente garantito che il peso medio tra i due campioni sarà almeno leggermente diverso. La questione è se questa differenza sia statisticamente significativa . Fortunatamente, un t-test su due campioni ci consente di rispondere a questa domanda.
Test t a due campioni: formula
Un t-test a due campioni utilizza sempre la seguente ipotesi nulla:
- H 0 : μ 1 = μ 2 (le due medie della popolazione sono uguali)
L’ipotesi alternativa può essere bilaterale, sinistra o destra:
- H 1 (a due code): μ 1 ≠ μ 2 (le medie delle due popolazioni non sono uguali)
- H 1 (a sinistra): μ 1 < μ 2 (la media della popolazione 1 è inferiore alla media della popolazione 2)
- H 1 (a destra): μ 1 > μ 2 (la media della popolazione 1 è maggiore della media della popolazione 2)
Usiamo la seguente formula per calcolare la statistica del test t:
Statistica del test: ( x 1 – x 2 ) / s p (√ 1/n 1 + 1/n 2 )
dove x 1 e x 2 sono le medie campionarie, n 1 e n 2 sono le dimensioni del campione e dove s p è calcolato come segue:
s p = √ (n 1 -1)s 1 2 + (n 2 -1)s 2 2 / (n 1 +n 2 -2)
dove s 1 2 e s 2 2 sono le varianze campionarie.
Se il valore p che corrisponde alla statistica del test t con (n 1 + n 2 -1) gradi di libertà è inferiore al livello di significatività scelto (le scelte comuni sono 0,10, 0,05 e 0, 01), allora può rifiutare l’ipotesi nulla. .
T-test a due campioni: ipotesi
Affinché i risultati di un test t su due campioni siano validi, devono essere soddisfatte le seguenti ipotesi:
- Le osservazioni di un campione devono essere indipendenti dalle osservazioni dell’altro campione.
- I dati dovrebbero essere distribuiti approssimativamente normalmente.
- I due campioni dovrebbero avere approssimativamente la stessa varianza. Se questo presupposto non è soddisfatto, è necessario eseguire invece il test t di Welch .
- I dati di entrambi i campioni sono stati ottenuti utilizzando un metodo di campionamento casuale .
T-test a due campioni : esempio
Supponiamo di voler sapere se il peso medio di due diverse specie di tartarughe è uguale o meno. Per verificarlo, eseguiremo un t-test a due campioni con un livello di significatività α = 0,05 utilizzando i seguenti passaggi:
Passaggio 1: raccogliere dati di esempio.
Supponiamo di raccogliere un campione casuale di tartarughe da ciascuna popolazione con le seguenti informazioni:
Esempio 1:
- Dimensione del campione n 1 = 40
- Peso medio del campione x 1 = 300
- Deviazione standard del campione s 1 = 18,5
Esempio 2:
- Dimensione del campione n2 = 38
- Peso medio del campione x 2 = 305
- Deviazione standard del campione s 2 = 16,7
Passaggio 2: definire le ipotesi.
Effettueremo il t-test a due campioni con le seguenti ipotesi:
- H 0 : μ 1 = μ 2 (le due medie della popolazione sono uguali)
- H 1 : μ 1 ≠ μ 2 (le due medie della popolazione non sono uguali)
Passaggio 3: calcolare la statistica t -test.
Innanzitutto, calcoleremo la deviazione standard aggregata s p :
s p = √ (n 1 -1)s 1 2 + (n 2 -1)s 2 2 / (n 1 +n 2 -2) = √ ( 40-1)18,5 2 + (38-1) 16,7 2 / (40+38-2) = 17.647
Successivamente, calcoleremo la statistica t -test:
t = ( x 1 – x 2 ) / s p (√ 1/n 1 + 1/n 2 ) = (300-305) / 17,647(√ 1/40 + 1/38 ) = -1,2508
Passaggio 4: calcolare il valore p della statistica t- test.
Secondo il calcolatore del punteggio T al valore P , il valore p associato a t = -1,2508 e gradi di libertà = n 1 + n 2 -2 = 40+38-2 = 76 è 0,21484 .
Passaggio 5: trarre una conclusione.
Poiché questo valore p non è inferiore al nostro livello di significatività α = 0,05, non riusciamo a rifiutare l’ipotesi nulla. Non abbiamo prove sufficienti per affermare che il peso medio delle tartarughe tra queste due popolazioni sia diverso.
Nota: è anche possibile eseguire l’intero t-test a due campioni semplicemente utilizzando il calcolatore del t-test a due campioni .
Risorse addizionali
I seguenti tutorial spiegano come eseguire un t-test a due campioni utilizzando diversi programmi statistici:
Come eseguire un test t a due campioni in Excel
Come eseguire un t-test a due campioni in SPSS
Come eseguire un t-test a due campioni in Stata
Come eseguire un t-test a due campioni in R
Come eseguire un t-test a due campioni in Python
Come eseguire un t-test su due campioni su una calcolatrice TI-84