La condizione di un campione numeroso: definizione ed esempio
Nelle statistiche, spesso vogliamo utilizzare campioni per trarre conclusioni sulle popolazioni attraverso test di ipotesi o intervalli di confidenza .
La maggior parte delle formule che utilizziamo nei test di ipotesi e negli intervalli di confidenza presuppongono che un dato campione segua approssimativamente una distribuzione normale .
Tuttavia, per formulare in modo sicuro questa ipotesi, dobbiamo garantire che la dimensione del nostro campione sia sufficientemente ampia. Nello specifico, dobbiamo garantire che sia soddisfatta la condizione del campione ampio .
La condizione del campione ampio: la dimensione del campione è almeno 30.
Nota: in alcuni libri di testo, una dimensione del campione “sufficientemente grande” è definita come almeno 40, ma il numero 30 è più comunemente utilizzato.
Quando questa condizione è soddisfatta, si può assumere che la distribuzione campionaria delle medie campionarie sia approssimativamente normale. Questa ipotesi ci consente di utilizzare i campioni per trarre conclusioni sulle popolazioni da cui sono estratti.
Il motivo per cui viene utilizzato il numero 30 si basa sul teorema del limite centrale. Puoi leggere di più a riguardo in questo post del blog .
Esempio: controllo dello stato di un campione di grandi dimensioni
Supponiamo che una certa macchina crei cracker. La distribuzione del peso di questi biscotti è sbilanciata verso destra con una media di 10 once e una deviazione standard di 2 once. Se prendiamo un campione casuale di 100 biscotti prodotti da questa macchina, qual è la probabilità che il peso medio dei biscotti in questo campione sia inferiore a 9,8 once?
Per rispondere a questa domanda possiamo utilizzare il normale calcolatore CDF , ma prima dobbiamo verificare che la dimensione del campione sia sufficientemente grande da assumere che la distribuzione della media campionaria sia normale.
In questo esempio, la dimensione del nostro campione è n = 100 , che è molto più grande di 30. Nonostante il fatto che la vera distribuzione del peso dei cookie sia distorta verso destra, poiché la dimensione del nostro campione è “abbastanza grande”, possiamo supporre che la distribuzione della media campionaria è normale. Quindi potremmo tranquillamente utilizzare il normale calcolatore CDF per risolvere questo problema.
Cambiamenti nella condizione di campioni di grandi dimensioni
Spesso, una dimensione del campione è considerata “abbastanza grande” se è maggiore o uguale a 30, ma questo numero può variare leggermente a seconda della forma sottostante della distribuzione della popolazione.
Particolarmente:
- Se la distribuzione della popolazione è simmetrica, a volte è sufficiente una dimensione del campione di soli 15 individui.
- Se la distribuzione della popolazione è distorta, di solito è necessario un campione di almeno 30 persone.
- Se la distribuzione della popolazione è estremamente asimmetrica, potrebbe essere necessario un campione di 40 o più persone.
A seconda della forma della distribuzione della popolazione, potrebbe essere necessaria una dimensione del campione maggiore o minore di 30 affinché si applichi il teorema del limite centrale.
Risorse addizionali
Introduzione al teorema del limite centrale
Introduzione alle distribuzioni campionarie