La dimensione minima del campione per un test t: spiegazione ed esempio
Una domanda comune posta dagli studenti è:
È richiesta una dimensione minima del campione per eseguire un t-test?
La risposta breve:
No. Non è richiesta una dimensione minima del campione per eseguire un t-test.
In effetti, il primo test t mai utilizzato ha utilizzato solo un campione di quattro persone .
Tuttavia, se le ipotesi di un test t non vengono soddisfatte, i risultati potrebbero non essere affidabili.
Inoltre, se la dimensione del campione è troppo piccola, la potenza del test potrebbe essere troppo bassa per rilevare differenze significative nei dati.
Esaminiamo ciascuno di questi potenziali problemi in modo più dettagliato.
Comprensione delle ipotesi del test t
Un test t su un campione viene utilizzato per verificare se la media di una popolazione è uguale o meno a un determinato valore.
Questo test parte dalle seguenti ipotesi:
- Indipendenza : le osservazioni del campione devono essere indipendenti.
- Campionamento casuale : le osservazioni dovrebbero essere raccolte utilizzando un metodo di campionamento casuale per massimizzare la possibilità che il campione sia rappresentativo della popolazione di interesse.
- Normalità : le osservazioni dovrebbero essere distribuite approssimativamente normalmente.
Viene utilizzato un t-test a due campioni per verificare se esiste una differenza significativa tra le medie di due popolazioni.
Questo test parte dalle seguenti ipotesi:
- Indipendenza : le osservazioni di ciascun campione devono essere indipendenti.
- Campionamento casuale : le osservazioni di ciascun campione devono essere raccolte utilizzando un metodo di campionamento casuale.
- Normalità : ciascun campione deve essere distribuito approssimativamente normalmente.
- Varianza uguale : ogni campione dovrebbe avere approssimativamente la stessa varianza.
Quando si esegue ciascun tipo di test t, se uno o più di questi presupposti non vengono soddisfatti, i risultati del test potrebbero diventare inaffidabili.
In questo caso, è meglio utilizzare un test non parametrico alternativo che non faccia queste ipotesi.
L’alternativa non parametrica al t-test per un campione è il test dei ranghi con segno di Wilcoxon .
L’alternativa non parametrica al t-test a due campioni è il test U di Mann-Whitney .
Comprendere la potenza dei test t
Il potere statistico si riferisce alla probabilità che un test rilevi un effetto quando esiste effettivamente.
Si può dimostrare che minore è la dimensione del campione utilizzato, minore è la potenza statistica di un dato test. Questo è il motivo per cui i ricercatori generalmente desiderano campioni di dimensioni più grandi per avere una potenza maggiore e quindi una maggiore probabilità di rilevare differenze reali.
Ad esempio, supponiamo che la dimensione dell’effetto reale tra due popolazioni sia 0,5 – una dimensione dell’effetto “media”. Possiamo utilizzare il seguente codice R per calcolare la potenza di un test t a due campioni utilizzando diverse dimensioni del campione:
#sample size n=10 power. t . test (n=10, delta=.5, sd=1, sig.level=.05, type=' two.sample ')$power [1] 0.1838375 #sample size n=30 power. t . test (n=30, delta=.5, sd=1, sig.level=.05, type=' two.sample ')$power [1] 0.477841 #sample size n=50 power. t . test (n=50, delta=.5, sd=1, sig.level=.05, type=' two.sample ')$power [1] 0.6968888
Ecco come interpretare i risultati:
- Quando la dimensione di ciascun campione è n = 10, la potenza è 0,184 .
- Quando la dimensione di ciascun campione è n = 30, la potenza è 0,478 .
- Quando la dimensione di ciascun campione è n = 50, la potenza è 0,697 .
Possiamo vedere che la potenza del test aumenta all’aumentare della dimensione del campione.
Pertanto, non abbiamo bisogno di una dimensione minima del campione per eseguire un t-test, ma dimensioni ridotte del campione portano a un potere statistico inferiore e quindi a una ridotta capacità di rilevare una vera differenza nei dati.
Conclusione
Ecco un riepilogo di ciò che abbiamo imparato:
- Non è richiesta una dimensione minima del campione per eseguire un t-test.
- Se le ipotesi di un test t non vengono soddisfatte, dobbiamo utilizzare un’alternativa non parametrica.
- Se la dimensione del campione è troppo piccola, la potenza del t-test sarà bassa e la capacità del test di rilevare differenze reali nei dati sarà bassa.
Risorse addizionali
Le esercitazioni seguenti offrono informazioni aggiuntive sui test t.
Un’introduzione al t-test per un campione
Un’introduzione al test t a due campioni
Un’introduzione al t-test per campioni appaiati
Le quattro ipotesi formulate in un t test