Teorema del limite centrale: definizione + esempi
Il teorema del limite centrale afferma che la distribuzione campionaria di una media campionaria è approssimativamente normale se la dimensione del campione è sufficientemente grande, anche se la distribuzione della popolazione non è normale .
Il teorema del limite centrale afferma inoltre che la distribuzione campionaria avrà le seguenti proprietà:
1. La media della distribuzione campionaria sarà uguale alla media della distribuzione della popolazione:
x = µ
2. La varianza della distribuzione campionaria sarà uguale alla varianza della distribuzione della popolazione divisa per la dimensione del campione:
s2 = σ2 /n
Esempi del Teorema del Limite Centrale
Ecco alcuni esempi per illustrare nella pratica il teorema del limite centrale.
Distribuzione uniforme
Supponiamo che la larghezza del guscio di una tartaruga segua una distribuzione uniforme con una larghezza minima di 2 pollici e una larghezza massima di 6 pollici. Cioè, se selezioniamo una tartaruga a caso e misuriamo la larghezza del suo guscio, è probabile che sia larga tra 2 e 6 pollici.
Se creassimo un istogramma per rappresentare la distribuzione della larghezza del guscio della tartaruga, sarebbe simile a questo:
La media di una distribuzione uniforme è μ = (b+a) / 2 dove b è il valore più grande possibile e a è il valore più piccolo possibile. In questo caso è (6+2) / 2 = 4.
La varianza di una distribuzione uniforme è σ2 = (ba) 2/12 . In questo caso è (6-2) 2/12 = 1,33
Prelievo di campioni casuali di 2 dalla distribuzione uniforme
Ora immaginiamo di prendere un campione casuale di 2 tartarughe da questa popolazione e di misurare la larghezza del guscio di ciascuna tartaruga. Supponiamo che il guscio della prima tartaruga sia largo 3 pollici e che il secondo sia largo 6 pollici. La larghezza media di questo campione di 2 tartarughe è di 4,5 pollici.
Successivamente, immagina di prendere un altro campione casuale di 2 tartarughe da questa popolazione e di misurare nuovamente la larghezza del guscio di ciascuna tartaruga. Supponiamo che il guscio della prima tartaruga sia largo 2,5 pollici e che anche il secondo sia largo 2,5 pollici. La larghezza media di questo campione di 2 tartarughe è di 2,5 pollici.
Immagina di continuare a prelevare campioni casuali da 2 tartarughe più e più volte e di continuare a trovare ogni volta la larghezza media del guscio.
Se creassimo un istogramma per rappresentare la larghezza media del guscio di tutti questi campioni di 2 tartarughe, sarebbe simile a questo:
Questa è chiamata distribuzione campionaria per le medie campionarie perché mostra la distribuzione delle medie campionarie.
La media di questa distribuzione campionaria è x = μ = 4
La varianza di questa distribuzione campionaria è s2 = σ2 / n = 1,33 / 2 = 0,665
Prelievo di campioni casuali di 5 dalla distribuzione uniforme
Ora immaginiamo di ripetere lo stesso esperimento, ma questa volta prendiamo ripetutamente campioni casuali da 5 tartarughe e troviamo ogni volta la larghezza media del guscio.
Se creassimo un istogramma per rappresentare la larghezza media del guscio di tutti questi campioni di 5 tartarughe, sarebbe simile a questo:
Si noti che questa distribuzione ha più una forma a “campana” che assomiglia alla distribuzione normale . Questo perché quando prendiamo campioni di 5, la varianza tra le nostre medie campionarie è molto più bassa, quindi abbiamo meno probabilità di ottenere campioni con una media vicina a 2 pollici o 6 pollici e più probabilità di ottenere campioni con una media vicina a 2 pollici o 6 pollici. 6 pollici. la media è più vicina alla media della popolazione effettiva di 4 pollici.
La media di questa distribuzione campionaria è x = μ = 4
La varianza di questa distribuzione campionaria è s2 = σ2 / n = 1,33 / 5 = 0,266
Prelievo di campioni casuali di 30 dalla distribuzione uniforme
Ora immaginiamo di ripetere lo stesso esperimento, ma questa volta prendiamo ripetutamente campioni casuali da 30 tartarughe e troviamo ogni volta la larghezza media del guscio.
Se creassimo un istogramma per rappresentare la larghezza media del guscio di tutti questi campioni di 30 tartarughe, sarebbe simile a questo:
Si noti che questa distribuzione campionaria è ancora più a campana e molto più ristretta rispetto alle due distribuzioni precedenti.
La media di questa distribuzione campionaria è x = μ = 4
La varianza di questa distribuzione campionaria è s2 = σ2 / n = 1,33 / 30 = 0,044
La distribuzione chi quadrato
Supponiamo che il numero di animali domestici per famiglia in una determinata città segua una distribuzione chi-quadrato con tre gradi di libertà. Se creassimo un istogramma per rappresentare la distribuzione degli animali per famiglia, sarebbe simile a questo:
La media di una distribuzione chi-quadrato è semplicemente il numero di gradi di libertà (df). In questo caso, μ = 3 .
La varianza di una distribuzione Chi-quadrato è 2 * df. In questo caso, σ2 = 2 * 3 = 6 .
Prelevando campioni casuali di 2
Immaginiamo di prendere un campione casuale di 2 famiglie da questa popolazione e di contare il numero di animali domestici in ciascuna famiglia. Supponiamo che la prima famiglia abbia 4 animali domestici e la seconda famiglia abbia 1 animale domestico. Il numero medio di animali domestici per questo campione di 2 famiglie è 2,5.
Quindi immaginiamo di prendere un altro campione casuale di 2 famiglie da questa popolazione e di contare nuovamente il numero di animali domestici in ciascuna famiglia. Supponiamo che la prima famiglia abbia 6 animali domestici e che la seconda famiglia abbia 4 animali domestici. Il numero medio di animali domestici per questo campione di 2 famiglie è 5.
Immaginiamo di continuare a prelevare campioni casuali da 2 famiglie più e più volte e di continuare a trovare ogni volta il numero medio di animali domestici.
Se creassimo un istogramma per rappresentare il numero medio di animali domestici di tutti questi campioni provenienti da 2 famiglie, sarebbe simile a questo:
La media di questa distribuzione campionaria è x = μ = 3
La varianza di questa distribuzione campionaria è s 2 = σ 2 / n = 6 / 2 = 3
Prelievo di campioni casuali di 10
Ora immaginiamo di ripetere lo stesso esperimento, ma questa volta prendiamo ripetutamente campioni casuali di 10 famiglie e ogni volta troviamo il numero medio di animali per famiglia.
Se creassimo un istogramma per rappresentare il numero medio di animali per famiglia in tutti questi campioni di 10 famiglie, sarebbe simile a questo:
La media di questa distribuzione campionaria è x = μ = 3
La varianza di questa distribuzione campionaria è s2 = σ2 / n = 6/10 = 0,6
Prelievo di campioni casuali di 30
Ora immaginiamo di ripetere lo stesso esperimento, ma questa volta prendiamo ripetutamente campioni casuali di 30 famiglie e ogni volta troviamo il numero medio di animali per famiglia.
Se creassimo un istogramma per rappresentare il numero medio di animali per famiglia in tutti questi campioni di 30 famiglie, sarebbe simile a questo:
La media di questa distribuzione campionaria è x = μ = 3
La varianza di questa distribuzione campionaria è s2 = σ2 / n = 6/30 = 0,2
Riepilogo
Ecco i principali insegnamenti di questi due esempi:
- La distribuzione campionaria di una media campionaria è approssimativamente normale se la dimensione del campione è sufficientemente grande, anche se la distribuzione della popolazione non è normale . Nei due esempi precedenti, né la distribuzione uniforme né la distribuzione chi-quadrato erano normali (non erano affatto a forma di “campana”), ma quando abbiamo preso un campione abbastanza grande, la distribuzione della media campionaria si è trasformata in essere normale.
- Maggiore è la dimensione del campione, minore è la varianza della media campionaria.
Definire “abbastanza grande”
Ricordiamo che il teorema del limite centrale afferma che la distribuzione campionaria di una media campionaria è approssimativamente normale se la dimensione del campione è “abbastanza grande” , anche se la distribuzione della popolazione non è normale.
Non esiste una definizione esatta di quanto dovrebbe essere grande un campione affinché si applichi il teorema del limite centrale, ma in generale dipende dall’asimmetria della distribuzione della popolazione da cui proviene il campione:
- Se la distribuzione della popolazione è simmetrica, a volte è sufficiente una dimensione del campione di soli 15 individui.
- Se la distribuzione della popolazione è distorta, di solito è necessario un campione di almeno 30 persone.
- Se la distribuzione della popolazione è estremamente asimmetrica, potrebbe essere necessario un campione di 40 o più persone.
Dai un’occhiata a questo tutorial sul condizionamento di un campione di grandi dimensioni per ulteriori informazioni su questo argomento.