Test t di welch: quando usarlo + esempi
Quando vogliamo confrontare le medie di due gruppi indipendenti, possiamo scegliere tra l’utilizzo di due test diversi:
Test t di Student: questo test presuppone che i due gruppi di dati siano campionati da popolazioni che seguono una distribuzione normale e che le due popolazioni abbiano la stessa varianza.
Test t di Welch: questo test presuppone che entrambi i gruppi di dati siano campionati da popolazioni che seguono una distribuzione normale, ma non presuppone che queste due popolazioni abbiano la stessa varianza .
La differenza tra il test t di Student e il test t di Welch
Esistono due differenze nel modo in cui vengono eseguiti il test t di Student e il test t di Welch:
- La statistica del test
- Gradi di libertà
Test t di Student:
Statistica del test: ( x 1 – x 2 ) / s p (√ 1/n 1 + 1/n 2 )
dove x 1 e x 2 sono le medie campionarie, n 1 e n 2 sono le dimensioni del campione rispettivamente per il campione 1 e il campione 2, e dove s p è calcolato come segue:
s p = √ (n 1 -1)s 1 2 + (n 2 -1)s 2 2 / (n 1 +n 2 -2)
dove s 1 2 e s 2 2 sono le varianze campionarie.
Gradi di libertà: n 1 + n 2 – 2
Test T di Welch
Statistica del test: ( x 1 – x 2 ) / (√ s 1 2 /n 1 + s 2 2 /n 2 )
Gradi di libertà: (s 1 2 /n 1 + s 2 2 /n 2 ) 2 / { [ (s 1 2 / n 1 ) 2 / (n 1 – 1) ] + [ (s 2 2 / n 2 ) 2 / (n 2 – 1) ] }
La formula per calcolare i gradi di libertà per il test t di Welch tiene conto della differenza tra le due deviazioni standard. Se i due campioni hanno le stesse deviazioni standard, allora i gradi di libertà del test t di Welch saranno esattamente gli stessi dei gradi di libertà del test t di Student.
Tipicamente, le deviazioni standard per i due campioni non sono le stesse e quindi i gradi di libertà del test t di Welch tendono ad essere inferiori ai gradi di libertà del test t di Student.
È anche importante notare che i gradi di libertà nel test t di Welch generalmente non sono numeri interi. Se stai testando manualmente, è meglio arrotondare al numero intero più basso. Se utilizzi un software statistico come R , il software sarà in grado di fornire il valore decimale dei gradi di libertà.
Quando dovresti utilizzare il test t di Welch?
Alcuni sostengono che il test t di Welch dovrebbe essere la scelta predefinita per confrontare le medie di due gruppi indipendenti perché funziona meglio del test t di Student quando le dimensioni e le varianze del campione sono disuguali tra i gruppi e fornisce risultati identici quando le dimensioni del campione sono diversi. le differenze sono uguali.
In pratica, quando si confrontano le medie di due gruppi, è improbabile che le deviazioni standard di ciascun gruppo siano le stesse. Quindi è una buona idea utilizzare sempre il test t di Welch, in modo da non dover fare ipotesi sull’uguaglianza delle varianze.
Esempi di utilizzo del test t di Welch
Successivamente, eseguiremo il test t di Welch sui seguenti due campioni per determinare se le medie della loro popolazione differiscono significativamente a un livello di significatività di 0,05:
Campione 1: 14, 15, 15, 15, 16, 18, 22, 23, 24, 25, 25
Esempio 2: 10, 12, 14, 15, 18, 22, 24, 27, 31, 33, 34, 34, 34
Illustreremo come eseguire il test in tre diverse modalità:
- Per mano
- Utilizzare Microsoft Excel
- Utilizzare il linguaggio di programmazione statistica R
Test T di Welch manualmente
Per eseguire manualmente il t-test di Welch, dobbiamo prima trovare le medie campionarie, le varianze campionarie e le dimensioni del campione:
x1 – 19:27
x2 – 23.69
12:00 – 20:42
arte 2 2 – 83.23
N. 1 – 11
N. 2 – 13
Quindi possiamo inserire questi numeri per trovare la statistica del test:
Statistica del test: ( x 1 – x 2 ) / (√ s 1 2 /n 1 + s 2 2 /n 2 )
Statistica del test: (19,27 – 23,69) / (√ 20,42/11 + 83,23/13 ) = -4,42 / 2,873 = -1,538
Gradi di libertà: (s 1 2 /n 1 + s 2 2 /n 2 ) 2 / { [ (s 1 2 / n 1 ) 2 / (n 1 – 1) ] + [ (s 2 2 / n 2 ) 2 / (n 2 – 1) ] }
Gradi di libertà: (20,42/11 + 83,23/13) 2 / { [ (20,42/11) 2 / (11 – 1) ] + [ (83,23/13) 2 / (13 – 1) ] } = 18,137. Arrotondiamo questo risultato all’intero più vicino, 18 .
Infine, troveremo il valore critico t nella tabella della distribuzione t che corrisponde a un test bilaterale con alpha = 0,05 per 18 gradi di libertà:
Il valore critico t è 2.101 . Poiché il valore assoluto della nostra statistica test (1.538) non è maggiore del valore critico t, non riusciamo a rifiutare l’ipotesi nulla del test. Non ci sono prove sufficienti per affermare che i mezzi delle due popolazioni siano significativamente diversi.
Test T di Welch con Excel
Per eseguire il test t di Welch in Excel, dobbiamo prima scaricare il software gratuito Analysis ToolPak. Se non l’hai già scaricato in Excel, ho scritto un breve tutorial su come scaricarlo .
Dopo aver scaricato Analysis ToolPak, puoi seguire i passaggi seguenti per eseguire il test t di Welch sui nostri due campioni:
1. Inserisci i dati. Inserisci i valori dei dati per i due campioni nelle colonne A e B e le intestazioni Campione 1 e Campione 2 nella prima cella di ciascuna colonna.
2. Eseguire il test t di Welch utilizzando Analysis ToolPak. Vai alla scheda Dati lungo la barra multifunzione in alto. Successivamente, nel gruppo Analisi , fare clic sull’icona Strumenti di analisi.
Nella finestra di dialogo visualizzata, fare clic su test t: due campioni che assumono varianze disuguali e quindi fare clic su OK.
Infine, inserisci i valori seguenti, quindi fai clic su OK:
Dovrebbe apparire il seguente risultato:
Tieni presente che i risultati di questo test corrispondono ai risultati che abbiamo ottenuto manualmente:
- La statistica del test è -1.5379 .
- Il valore critico bilaterale è 2.1009 .
- Poiché il valore assoluto della statistica test non è maggiore del valore critico a due code, le medie delle due popolazioni non sono statisticamente differenti.
- Inoltre, il valore p a due code del test è 0,14, che è maggiore di 0,05 e conferma che le medie delle due popolazioni non sono statisticamente diverse.
Test t di Welch utilizzando R
Il codice seguente illustra come eseguire il test t di Welch per i nostri due campioni utilizzando il linguaggio di programmazione statistica R :
#create two vectors to hold sample data values sample1 <- c(14, 15, 15, 15, 16, 18, 22, 23, 24, 25, 25) sample2 <- c(10, 12, 14, 15, 18, 22, 24, 27, 31, 33, 34, 34, 34) #conduct Welch's test t.test( sample1, sample2) # Welch Two Sample t-test # #data: sample1 and sample2 #t = -1.5379, df = 18.137, p-value = 0.1413 #alternative hypothesis: true difference in means is not equal to 0 #95 percent confidence interval: #-10.453875 1.614714 #sample estimates: #mean of x mean of y #19.27273 23.69231 #
La funzione t.test() visualizza il seguente output rilevante:
- t: la statistica del test = -1,5379
- df : gradi di libertà = 18.137
- valore p: il valore p del test a due code = 0,1413
- Intervallo di confidenza al 95% : l’ intervallo di confidenza al 95% per la vera differenza nelle medie della popolazione = (-10,45, 1,61)
I risultati di questo test corrispondono a quelli ottenuti manualmente e utilizzando Excel: la differenza nelle medie per queste due popolazioni non è statisticamente significativa a livello di alfa = 0,05.