Teorema del limite centrale: le quattro condizioni da soddisfare
Il teorema del limite centrale afferma che la distribuzione campionaria di una media campionaria è approssimativamente normale se la dimensione del campione è sufficientemente grande, anche se la distribuzione della popolazione non è normale .
Per applicare il teorema del limite centrale devono essere soddisfatte quattro condizioni:
1. Randomizzazione : i dati dovrebbero essere campionati in modo casuale in modo che ciascun membro di una popolazione abbia la stessa probabilità di essere selezionato per far parte del campione.
2. Indipendenza: i valori dei campioni devono essere indipendenti l’uno dall’altro.
3. La condizione del 10%: quando il campione viene estratto senza sostituzione, la dimensione del campione non deve superare il 10% della popolazione.
4. Condizione del campione di grandi dimensioni: la dimensione del campione deve essere sufficientemente grande.
Questo tutorial fornisce una breve spiegazione di ciascuna condizione.
Condizione 1: randomizzazione
Per applicare il teorema del limite centrale, i dati che utilizziamo devono essere campionati casualmente dalla popolazione utilizzando un metodo di campionamento probabilistico .
In statistica esistono due tipi di metodi di campionamento :
1. Metodi di campionamento probabilistico: metodi di campionamento in cui ciascun membro di una popolazione ha la stessa probabilità di essere selezionato per far parte del campione. Esempi inclusi:
- Campione casuale semplice
- Campione casuale stratificato
- Campione casuale clusterizzato
- Campionamento casuale sistematico
2. Metodi di campionamento non probabilistico: metodi di campionamento in cui ciascun membro di una popolazione non ha la stessa probabilità di essere selezionato per far parte del campione. Esempi inclusi:
- Campione di convenienza
- Campione di risposta volontaria
- Campione di palle di neve
- Campione puro
È importante utilizzare un metodo di campionamento probabilistico per ottenere il campione, poiché ciò massimizza le possibilità di ottenere un campione rappresentativo della popolazione .
Condizione 2: Indipendenza
Per applicare il teorema del limite centrale, dobbiamo anche assumere che ciascuno dei valori del campione sia indipendente l’uno dall’altro. In altre parole, il verificarsi di un evento non influenza il verificarsi di un altro evento.
Questa ipotesi è spesso soddisfatta se utilizziamo un metodo di campionamento probabilistico, poiché questi tipi di metodi di campionamento scelgono quali osservazioni includere nel campione in modo completamente indipendente l’uno dall’altro.
Condizione 3: la condizione del 10%.
Quando il campione viene estratto senza reinserimento (cosa che avviene quasi sempre), la dimensione del campione non deve superare il 10% della popolazione totale.
Per esempio:
- Se la dimensione della nostra popolazione è di 500 persone, la dimensione del nostro campione non dovrebbe superare le 50 persone.
- Se la dimensione della nostra popolazione è di 1.000 persone, il nostro campione non dovrebbe superare le 100 persone.
- Se la dimensione della nostra popolazione è di 50.000 persone, la dimensione del nostro campione non dovrebbe superare le 5.000 persone.
E così via.
Condizione 4: condizione del campione di grandi dimensioni
Infine, per applicare il teorema del limite centrale, la dimensione del nostro campione deve essere sufficientemente grande.
In genere, consideriamo “abbastanza grande” un numero pari o superiore a 30. Tuttavia, questo numero può variare leggermente a seconda della forma sottostante della distribuzione della popolazione.
Particolarmente:
- Se la distribuzione della popolazione è simmetrica, a volte è sufficiente una dimensione del campione di soli 15 individui.
- Se la distribuzione della popolazione è distorta, di solito è necessario un campione di almeno 30 persone.
- Se la distribuzione della popolazione è estremamente asimmetrica, potrebbe essere necessario un campione di 40 o più persone.
A seconda della forma della distribuzione della popolazione, potrebbe essere necessaria una dimensione del campione maggiore o minore di 30 affinché si applichi il teorema del limite centrale.