Test t di welch: quando usarlo + esempi


Quando vogliamo confrontare le medie di due gruppi indipendenti, possiamo scegliere tra l’utilizzo di due test diversi:

Test t di Student: questo test presuppone che i due gruppi di dati siano campionati da popolazioni che seguono una distribuzione normale e che le due popolazioni abbiano la stessa varianza.

Test t di Welch: questo test presuppone che entrambi i gruppi di dati siano campionati da popolazioni che seguono una distribuzione normale, ma non presuppone che queste due popolazioni abbiano la stessa varianza .

La differenza tra il test t di Student e il test t di Welch

Esistono due differenze nel modo in cui vengono eseguiti il test t di Student e il test t di Welch:

  • La statistica del test
  • Gradi di libertà

Test t di Student:

Statistica del test: ( x 1x 2 ) / s p (√ 1/n 1 + 1/n 2 )

dove x 1 e x 2 sono le medie campionarie, n 1 e n 2 sono le dimensioni del campione rispettivamente per il campione 1 e il campione 2, e dove s p è calcolato come segue:

s p = (n 1 -1)s 1 2 + (n 2 -1)s 2 2 / (n 1 +n 2 -2)

dove s 1 2 e s 2 2 sono le varianze campionarie.

Gradi di libertà: n 1 + n 2 – 2

Test T di Welch

Statistica del test: ( x 1x 2 ) / (√ s 1 2 /n 1 + s 2 2 /n 2 )

Gradi di libertà: (s 1 2 /n 1 + s 2 2 /n 2 ) 2 / { [ (s 1 2 / n 1 ) 2 / (n 1 – 1) ] + [ (s 2 2 / n 2 ) 2 / (n 2 – 1) ] }

La formula per calcolare i gradi di libertà per il test t di Welch tiene conto della differenza tra le due deviazioni standard. Se i due campioni hanno le stesse deviazioni standard, allora i gradi di libertà del test t di Welch saranno esattamente gli stessi dei gradi di libertà del test t di Student.

Tipicamente, le deviazioni standard per i due campioni non sono le stesse e quindi i gradi di libertà del test t di Welch tendono ad essere inferiori ai gradi di libertà del test t di Student.

È anche importante notare che i gradi di libertà nel test t di Welch generalmente non sono numeri interi. Se stai testando manualmente, è meglio arrotondare al numero intero più basso. Se utilizzi un software statistico come R , il software sarà in grado di fornire il valore decimale dei gradi di libertà.

Quando dovresti utilizzare il test t di Welch?

Alcuni sostengono che il test t di Welch dovrebbe essere la scelta predefinita per confrontare le medie di due gruppi indipendenti perché funziona meglio del test t di Student quando le dimensioni e le varianze del campione sono disuguali tra i gruppi e fornisce risultati identici quando le dimensioni del campione sono diversi. le differenze sono uguali.

In pratica, quando si confrontano le medie di due gruppi, è improbabile che le deviazioni standard di ciascun gruppo siano le stesse. Quindi è una buona idea utilizzare sempre il test t di Welch, in modo da non dover fare ipotesi sull’uguaglianza delle varianze.

Esempi di utilizzo del test t di Welch

Successivamente, eseguiremo il test t di Welch sui seguenti due campioni per determinare se le medie della loro popolazione differiscono significativamente a un livello di significatività di 0,05:

Campione 1: 14, 15, 15, 15, 16, 18, 22, 23, 24, 25, 25

Esempio 2: 10, 12, 14, 15, 18, 22, 24, 27, 31, 33, 34, 34, 34

Illustreremo come eseguire il test in tre diverse modalità:

  • Per mano
  • Utilizzare Microsoft Excel
  • Utilizzare il linguaggio di programmazione statistica R

Test T di Welch manualmente

Per eseguire manualmente il t-test di Welch, dobbiamo prima trovare le medie campionarie, le varianze campionarie e le dimensioni del campione:

x1 19:27
x2 23.69
12:00 20:42
arte 2 2 – 83.23
N. 1 – 11
N.
2 – 13

Quindi possiamo inserire questi numeri per trovare la statistica del test:

Statistica del test: ( x 1x 2 ) / (√ s 1 2 /n 1 + s 2 2 /n 2 )

Statistica del test: (19,27 – 23,69) / (√ 20,42/11 + 83,23/13 ) = -4,42 / 2,873 = -1,538

Gradi di libertà: (s 1 2 /n 1 + s 2 2 /n 2 ) 2 / { [ (s 1 2 / n 1 ) 2 / (n 1 – 1) ] + [ (s 2 2 / n 2 ) 2 / (n 2 – 1) ] }

Gradi di libertà: (20,42/11 + 83,23/13) 2 / { [ (20,42/11) 2 / (11 – 1) ] + [ (83,23/13) 2 / (13 – 1) ] } = 18,137. Arrotondiamo questo risultato all’intero più vicino, 18 .

Infine, troveremo il valore critico t nella tabella della distribuzione t che corrisponde a un test bilaterale con alpha = 0,05 per 18 gradi di libertà:

Tabella di distribuzione T

Il valore critico t è 2.101 . Poiché il valore assoluto della nostra statistica test (1.538) non è maggiore del valore critico t, non riusciamo a rifiutare l’ipotesi nulla del test. Non ci sono prove sufficienti per affermare che i mezzi delle due popolazioni siano significativamente diversi.

Test T di Welch con Excel

Per eseguire il test t di Welch in Excel, dobbiamo prima scaricare il software gratuito Analysis ToolPak. Se non l’hai già scaricato in Excel, ho scritto un breve tutorial su come scaricarlo .

Dopo aver scaricato Analysis ToolPak, puoi seguire i passaggi seguenti per eseguire il test t di Welch sui nostri due campioni:

1. Inserisci i dati. Inserisci i valori dei dati per i due campioni nelle colonne A e B e le intestazioni Campione 1 e Campione 2 nella prima cella di ciascuna colonna.

2. Eseguire il test t di Welch utilizzando Analysis ToolPak. Vai alla scheda Dati lungo la barra multifunzione in alto. Successivamente, nel gruppo Analisi , fare clic sull’icona Strumenti di analisi.

Nella finestra di dialogo visualizzata, fare clic su test t: due campioni che assumono varianze disuguali e quindi fare clic su OK.

Infine, inserisci i valori seguenti, quindi fai clic su OK:

Dovrebbe apparire il seguente risultato:

Tieni presente che i risultati di questo test corrispondono ai risultati che abbiamo ottenuto manualmente:

  • La statistica del test è -1.5379 .
  • Il valore critico bilaterale è 2.1009 .
  • Poiché il valore assoluto della statistica test non è maggiore del valore critico a due code, le medie delle due popolazioni non sono statisticamente differenti.
  • Inoltre, il valore p a due code del test è 0,14, che è maggiore di 0,05 e conferma che le medie delle due popolazioni non sono statisticamente diverse.

Test t di Welch utilizzando R

Il codice seguente illustra come eseguire il test t di Welch per i nostri due campioni utilizzando il linguaggio di programmazione statistica R :

 #create two vectors to hold sample data values
sample1 <- c(14, 15, 15, 15, 16, 18, 22, 23, 24, 25, 25)
sample2 <- c(10, 12, 14, 15, 18, 22, 24, 27, 31, 33, 34, 34, 34)

#conduct Welch's test
t.test( sample1, sample2)

# Welch Two Sample t-test
#
#data: sample1 and sample2
#t = -1.5379, df = 18.137, p-value = 0.1413
#alternative hypothesis: true difference in means is not equal to 0
#95 percent confidence interval:
#-10.453875 1.614714
#sample estimates:
#mean of x mean of y 
#19.27273 23.69231 
#

La funzione t.test() visualizza il seguente output rilevante:

  • t: la statistica del test = -1,5379
  • df : gradi di libertà = 18.137
  • valore p: il valore p del test a due code = 0,1413
  • Intervallo di confidenza al 95% : l’ intervallo di confidenza al 95% per la vera differenza nelle medie della popolazione = (-10,45, 1,61)

I risultati di questo test corrispondono a quelli ottenuti manualmente e utilizzando Excel: la differenza nelle medie per queste due popolazioni non è statisticamente significativa a livello di alfa = 0,05.

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *