Le quattro ipotesi formulate in un t test


Un t-test a due campioni viene utilizzato per verificare se le medie di due popolazioni sono uguali o meno.

Questo tipo di test fa le seguenti ipotesi sui dati:

1. Indipendenza: le osservazioni di un campione sono indipendenti dalle osservazioni dell’altro campione.

2. Normalità: entrambi i campioni hanno una distribuzione approssimativamente normale.

3. Omogeneità delle varianze: i due campioni hanno approssimativamente la stessa varianza.

4. Campionamento casuale: entrambi i campioni sono stati ottenuti utilizzando il metodo di campionamento casuale.

Se uno o più di questi presupposti vengono violati, i risultati del t-test su due campioni potrebbero essere inaffidabili o addirittura fuorvianti.

In questo tutorial forniamo una spiegazione di ciascun presupposto, come determinare se il presupposto è soddisfatto e cosa fare se viene violato.

Ipotesi 1: Indipendenza

Un t-test a due campioni presuppone che le osservazioni di un campione siano indipendenti dalle osservazioni dell’altro campione.

Questo è un presupposto cruciale perché se gli stessi individui compaiono in entrambi i campioni, non è valido trarre conclusioni sulle differenze tra i campioni.

Come verificare questa ipotesi

Il modo più semplice per verificare questa ipotesi è verificare che ciascuna osservazione appaia solo una volta in ciascun campione e che le osservazioni in ciascun campione siano state raccolte mediante campionamento casuale.

Cosa fare se questo presupposto non viene rispettato

Se questo presupposto non viene soddisfatto, i risultati del t-test su due campioni non sono completamente validi. In questo scenario, è meglio raccogliere due nuovi campioni utilizzando un metodo di campionamento casuale e garantire che ciascun individuo in un campione non appartenga all’altro campione.

Ipotesi 2: normalità

Un t-test a due campioni presuppone che i due campioni siano distribuiti approssimativamente normalmente.

Questo è un presupposto cruciale perché se i campioni non sono distribuiti normalmente, non è valido utilizzare i valori p del test per trarre conclusioni sulle differenze tra i campioni.

Come verificare questa ipotesi

Se le dimensioni del campione sono piccole (n <50), allora possiamo utilizzare un test di Shapiro-Wilk per determinare se ciascuna dimensione del campione è distribuita normalmente. Se il valore p del test è inferiore a un certo livello di significatività, probabilmente i dati non sono distribuiti normalmente.

Se le dimensioni del campione sono grandi, è meglio utilizzare un grafico QQ per verificare visivamente se i dati sono distribuiti normalmente.

Se i punti dati si trovano all’incirca lungo una linea diagonale retta in un grafico QQ, allora il set di dati probabilmente segue una distribuzione normale.

Cosa fare se questo presupposto non viene rispettato

Se questa ipotesi viene violata, allora possiamo eseguire un test U di Mann-Whitney , che è considerato l’equivalente non parametrico del test t a due campioni e non presuppone che i due campioni siano distribuiti normalmente.

Ipotesi 3: Omogeneità delle differenze

Un t-test a due campioni presuppone che i due campioni abbiano varianze approssimativamente uguali.

Come verificare questa ipotesi

Usiamo la seguente regola pratica per determinare se le varianze tra i due campioni sono uguali: Se il rapporto tra la varianza maggiore e la varianza minima è inferiore a 4, allora possiamo supporre che le varianze siano approssimativamente uguali e utilizzare entrambi i campioni t -test.

Ad esempio, supponiamo che il campione 1 abbia una varianza di 24,5 e il campione 2 abbia una varianza di 15,2. Il rapporto tra la varianza campionaria più grande e la varianza campionaria più piccola verrebbe calcolato come segue:

Rapporto: 24,5 / 15,2 = 1,61

Essendo questo rapporto inferiore a 4, si potrebbe supporre che le differenze tra i due gruppi siano approssimativamente uguali.

Cosa fare se questo presupposto non viene rispettato

Se questo presupposto viene violato, è possibile eseguire il test t di Welch , che è una versione non parametrica del test t a due campioni e non presuppone che i due campioni abbiano varianze uguali.

Ipotesi 4: campionamento casuale

Un t-test a due campioni presuppone che entrambi i campioni siano stati ottenuti utilizzando un metodo di campionamento casuale.

Come verificare questa ipotesi

Non esiste un test statistico formale che possiamo utilizzare per verificare questa ipotesi. Dobbiamo invece semplicemente assicurarci che entrambi i campioni siano stati ottenuti utilizzando un metodo di campionamento casuale tale che ogni individuo nella popolazione di interesse abbia la stessa probabilità di essere incluso nell’uno o nell’altro campione.

Cosa fare se questo presupposto non viene rispettato

Se questa ipotesi non viene soddisfatta, è improbabile che i nostri due campioni siano rappresentativi della popolazione di interesse. In questo caso, non possiamo generalizzare in modo affidabile i risultati del t-test a due campioni alla popolazione complessiva.

In questo scenario, è meglio raccogliere due nuovi campioni utilizzando un metodo di campionamento casuale.

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *