Qual è la differenza tra un test t e un anova?


Questo tutorial spiega la differenza tra un test t e un ANOVA , nonché quando utilizzare ciascun test.

Prova T

Un t-test viene utilizzato per determinare se esiste o meno una differenza statisticamente significativa tra le medie di due gruppi . Esistono due tipi di test t:

1. Test t per campioni indipendenti. Viene utilizzato quando vogliamo confrontare la differenza tra le medie di due gruppi e i gruppi sono completamente indipendenti l’uno dall’altro.

Ad esempio, i ricercatori potrebbero voler sapere se la dieta A o la dieta B aiuta le persone a perdere più peso. 100 persone assegnate in modo casuale vengono assegnate alla dieta A. Altre 100 persone assegnate in modo casuale vengono assegnate alla dieta B. Dopo tre mesi, i ricercatori registrano la perdita di peso totale di ciascuna persona. Per determinare se la perdita di peso media tra i due gruppi è significativamente diversa, i ricercatori possono eseguire un t-test su campioni indipendenti.

2. Test t per campioni accoppiati . Viene utilizzato quando vogliamo confrontare la differenza tra le medie di due gruppi e dove ciascuna osservazione di un gruppo può essere associata a un’osservazione dell’altro gruppo.

Ad esempio, supponiamo che 20 studenti in una classe facciano un test, poi studino una determinata guida, quindi sostengano di nuovo il test. Per confrontare la differenza tra i punteggi del primo e del secondo test, utilizziamo un test t accoppiato perché per ogni studente, il punteggio del primo test può essere associato al punteggio del secondo test.

Affinché un test t produca risultati validi, devono essere soddisfatte le seguenti ipotesi:

  • Casuale: per raccogliere dati per entrambi i campioni è necessario utilizzare un campione casuale o un esperimento casuale.
  • Normale: la distribuzione del campionamento è normale o approssimativamente normale.

Se queste ipotesi sono soddisfatte, è possibile utilizzare un test t per testare la differenza tra le medie di due gruppi.

ANOVA

Un’ANOVA (analisi della varianza) viene utilizzata per determinare se esiste o meno una differenza statisticamente significativa tra le medie di tre o più gruppi . I test ANOVA più comunemente utilizzati nella pratica sono ANOVA a una via e ANOVA a due vie:

ANOVA unidirezionale: utilizzato per verificare se esiste o meno una differenza statisticamente significativa tra le medie di tre o più gruppi quando i gruppi possono essere suddivisi in base a un singolo fattore .

Esempio: dividi casualmente una classe di 90 studenti in tre gruppi di 30. Ciascun gruppo utilizza una tecnica di studio diversa per un mese per prepararsi a un esame. Alla fine del mese tutti gli studenti sostengono lo stesso esame. Vuoi sapere se la tecnica di studio ha o meno un impatto sui punteggi degli esami. Quindi esegui un’ANOVA unidirezionale per determinare se esiste una differenza statisticamente significativa tra i punteggi medi dei tre gruppi.

ANOVA a due vie: utilizzato per verificare se esiste o meno una differenza statisticamente significativa tra le medie di tre o più gruppi quando i gruppi possono essere suddivisi in due fattori .

Esempio: vuoi determinare se il livello di esercizio (nessun esercizio, esercizio leggero, esercizio intenso) e il sesso (maschio, femmina) influiscono sulla perdita di peso. In questo caso, i due fattori che stai studiando sono l’esercizio fisico e il sesso e la variabile di risposta è la perdita di peso (misurata in libbre). È possibile eseguire un’ANOVA bidirezionale per determinare se l’esercizio fisico e il sesso influiscono sulla perdita di peso e per determinare se esiste un’interazione tra esercizio fisico e sesso sulla perdita di peso.

Affinché un’ANOVA produca risultati validi, devono essere soddisfatte le seguenti ipotesi:

  • Normalità : tutte le popolazioni che studiamo seguono una distribuzione normale. Quindi, ad esempio, se vogliamo confrontare i punteggi degli esami di tre diversi gruppi di studenti, i punteggi degli esami del primo gruppo, del secondo gruppo e del terzo gruppo dovrebbero essere tutti distribuiti normalmente.
  • Varianza uguale : le varianze della popolazione in ciascun gruppo sono uguali o approssimativamente uguali.
  • Indipendenza : le osservazioni di ciascun gruppo devono essere indipendenti l’una dall’altra. Di solito un disegno randomizzato si occupa di questo.

Se queste ipotesi sono soddisfatte, è possibile utilizzare un’ANOVA per testare la differenza tra le medie di tre o più gruppi.

Comprendere le differenze tra ciascun test

La differenza principale tra un test t e un ANOVA è il modo in cui entrambi i test calcolano la statistica del test per determinare se esiste una differenza statisticamente significativa tra i gruppi.

Un t-test per campioni indipendente utilizza la seguente statistica di test:

statistica del test t = [ ( x 1x 2 ) – d ] / (√ s 2 1 / n 1 + s 2 2 / n 2 )

dove x 1 e x 2 sono le medie campionarie per i gruppi 1 e 2, d è la differenza ipotetica tra le due medie (spesso è zero), s 1 2 e s 2 2 sono le varianze campionarie per i gruppi 1 e 2, e n 1 e n 2 sono le dimensioni del campione rispettivamente per i gruppi 1 e 2.

Un t-test per campioni appaiati utilizza la seguente statistica del test:

statistica del test t = d / (s d / √n)

dove d è la differenza media tra i due gruppi, s d è la deviazione standard delle differenze e n è la dimensione del campione per ciascun gruppo (nota che entrambi i gruppi avranno la stessa dimensione del campione).

Un’ANOVA utilizza la seguente statistica di test:

statistica del test F = s 2 b / s 2 w

dove s2b è la varianza tra campioni e s2w è la varianza intracampione.

Un t-test misura il rapporto tra la differenza media tra due gruppi e la deviazione standard complessiva delle differenze. Se questo rapporto è sufficientemente alto, è una prova sufficiente che esiste una differenza significativa tra i due gruppi.

Un’ANOVA, invece, misura il rapporto tra la varianza tra i gruppi rispetto alla varianza all’interno dei gruppi. Come il t-test, se questo rapporto è sufficientemente alto, fornisce prove sufficienti che i tre gruppi non hanno la stessa media.

Un’altra differenza fondamentale tra un test t e un ANOVA è che il test t può dirci se due gruppi hanno o meno la stessa media. Un’ANOVA, invece, ci dice se tre gruppi hanno tutti la stessa media, ma non ci dice esplicitamente quali gruppi hanno medie diverse l’uno dall’altro.

Per scoprire quali gruppi differiscono tra loro, sarebbero necessari test post hoc .

Comprendi quando utilizzare ciascun test

In pratica, quando vogliamo confrontare le medie di due gruppi , utilizziamo il test t. Quando vogliamo confrontare le medie di tre o più gruppi , utilizziamo un’ANOVA.

Il motivo di fondo per cui non utilizziamo semplicemente più test t per confrontare le medie di tre o più gruppi risale alla comprensione del tasso di errore di tipo I. Supponiamo di voler confrontare le medie di tre gruppi: il gruppo A, il gruppo B e il gruppo C. Potresti essere tentato di eseguire i seguenti tre t-test:

  • Un test t per confrontare la differenza nelle medie tra il gruppo A e il gruppo B
  • Un test t per confrontare la differenza nelle medie tra il gruppo A e il gruppo C
  • Un test t per confrontare la differenza nelle medie tra il gruppo B e il gruppo C

Per ogni t-test esiste la possibilità di commettere un errore di tipo I , ovvero la probabilità di rifiutare l’ipotesi nulla quando in realtà è vera. Questa probabilità è generalmente del 5%. Ciò significa che quando eseguiamo più test t, questo tasso di errore aumenta. Per esempio:

  • La probabilità di commettere un errore di tipo I con un singolo test t è 1 – 0,95 = 0,05 .
  • La probabilità di commettere un errore di tipo I con due test t è 1 – (0,95 2 ) = 0,0975 .
  • La probabilità di commettere un errore di tipo I con due test t è 1 – (0,95 3 ) = 0,1427 .

Questo tasso di errore è inaccettabilmente elevato. Fortunatamente, un’ANOVA controlla questi errori in modo che l’errore di tipo I rimanga solo al 5%. Ciò ci consente di essere più sicuri che il risultato di un test statisticamente significativo sia effettivamente significativo e non solo un risultato ottenuto dall’esecuzione di numerosi test.

Quindi, quando vogliamo capire se c’è una differenza tra le medie di tre o più gruppi, dobbiamo utilizzare un’ANOVA in modo che i nostri risultati siano statisticamente validi e affidabili.

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *