La condizione di un campione numeroso: definizione ed esempio


Nelle statistiche, spesso vogliamo utilizzare campioni per trarre conclusioni sulle popolazioni attraverso test di ipotesi o intervalli di confidenza .

La maggior parte delle formule che utilizziamo nei test di ipotesi e negli intervalli di confidenza presuppongono che un dato campione segua approssimativamente una distribuzione normale .

Tuttavia, per formulare in modo sicuro questa ipotesi, dobbiamo garantire che la dimensione del nostro campione sia sufficientemente ampia. Nello specifico, dobbiamo garantire che sia soddisfatta la condizione del campione ampio .

La condizione del campione ampio: la dimensione del campione è almeno 30.

Nota: in alcuni libri di testo, una dimensione del campione “sufficientemente grande” è definita come almeno 40, ma il numero 30 è più comunemente utilizzato.

Quando questa condizione è soddisfatta, si può assumere che la distribuzione campionaria delle medie campionarie sia approssimativamente normale. Questa ipotesi ci consente di utilizzare i campioni per trarre conclusioni sulle popolazioni da cui sono estratti.

Il motivo per cui viene utilizzato il numero 30 si basa sul teorema del limite centrale. Puoi leggere di più a riguardo in questo post del blog .

Esempio: controllo dello stato di un campione di grandi dimensioni

Supponiamo che una certa macchina crei cracker. La distribuzione del peso di questi biscotti è sbilanciata verso destra con una media di 10 once e una deviazione standard di 2 once. Se prendiamo un campione casuale di 100 biscotti prodotti da questa macchina, qual è la probabilità che il peso medio dei biscotti in questo campione sia inferiore a 9,8 once?

Per rispondere a questa domanda possiamo utilizzare il normale calcolatore CDF , ma prima dobbiamo verificare che la dimensione del campione sia sufficientemente grande da assumere che la distribuzione della media campionaria sia normale.

In questo esempio, la dimensione del nostro campione è n = 100 , che è molto più grande di 30. Nonostante il fatto che la vera distribuzione del peso dei cookie sia distorta verso destra, poiché la dimensione del nostro campione è “abbastanza grande”, possiamo supporre che la distribuzione della media campionaria è normale. Quindi potremmo tranquillamente utilizzare il normale calcolatore CDF per risolvere questo problema.

Cambiamenti nella condizione di campioni di grandi dimensioni

Spesso, una dimensione del campione è considerata “abbastanza grande” se è maggiore o uguale a 30, ma questo numero può variare leggermente a seconda della forma sottostante della distribuzione della popolazione.

Particolarmente:

  • Se la distribuzione della popolazione è simmetrica, a volte è sufficiente una dimensione del campione di soli 15 individui.
  • Se la distribuzione della popolazione è distorta, di solito è necessario un campione di almeno 30 persone.
  • Se la distribuzione della popolazione è estremamente asimmetrica, potrebbe essere necessario un campione di 40 o più persone.

A seconda della forma della distribuzione della popolazione, potrebbe essere necessaria una dimensione del campione maggiore o minore di 30 affinché si applichi il teorema del limite centrale.

Risorse addizionali

Introduzione al teorema del limite centrale
Introduzione alle distribuzioni campionarie

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *