Livello di confidenza e intervallo di confidenza: qual è la differenza?
Spesso nelle statistiche cerchiamo di misurare i parametri della popolazione – numeri che descrivono determinate caratteristiche di un’intera popolazione .
Ad esempio, potremmo essere interessati a misurare l’altezza media degli uomini in un determinato paese.
Poiché raccogliere dati sull’altezza di ogni uomo nel paese è troppo costoso e dispendioso in termini di tempo, raccoglieremmo invece dati su un semplice campione casuale di uomini. Utilizzeremmo quindi l’altezza media degli uomini in questo campione per stimare l’altezza media di tutti gli uomini nel paese.
Sfortunatamente, non è garantito che l’altezza media degli uomini nel campione corrisponda esattamente all’altezza media degli uomini nell’intera popolazione. Ad esempio, potremmo scegliere un campione di uomini più bassi o forse un campione di uomini più alti.
Per catturare la nostra incertezza sulla stima della media reale della popolazione, possiamo creare un intervallo di confidenza.
Intervallo di confidenza: intervallo di valori che possono contenere un parametro della popolazione con un certo livello di confidenza.
Un intervallo di confidenza viene calcolato utilizzando la seguente formula generale:
Intervallo di confidenza = (stima puntuale) +/- (valore critico)* (errore standard)
Ad esempio, la formula per calcolare un intervallo di confidenza per la media della popolazione è:
Intervallo di confidenza = x +/- z*(s/√ n )
Oro:
- x : media campionaria
- z: il valore critico di z
- s: deviazione standard campionaria
- n: dimensione del campione
Il valore z critico utilizzato nella formula dipende dal livello di confidenza scelto.
Livello di confidenza: percentuale di tutti i possibili campioni che si prevede includano il parametro della popolazione reale.
Le scelte più comuni per i livelli di confidenza sono 90%, 95% e 99%.
La tabella seguente mostra il valore z critico che corrisponde a queste scelte comuni del livello di confidenza:
Un livello di fiducia | valore critico z |
---|---|
0,90 | 1.645 |
0,95 | 1,96 |
0,99 | 2.58 |
Ad esempio, supponiamo di aver misurato l’altezza di 25 uomini e di aver trovato quanto segue:
- Dimensione del campione n = 25
- Altezza media del campione x = 70 pollici
- Deviazione standard del campione s = 1,2 pollici
Ecco come calcolare un intervallo di confidenza per la dimensione media reale della popolazione utilizzando un livello di confidenza del 90% :
Intervallo di confidenza al 90%: 70 +/- 1,645*(1,2/√25) = [69,6052, 70,3948]
Ciò significa che se utilizzassimo lo stesso metodo di campionamento per selezionare campioni diversi e calcolassimo un intervallo di confidenza per ciascun campione, ci aspetteremmo che la dimensione media reale della popolazione rientri nell’intervallo nel 90% dei casi.
Supponiamo ora di calcolare invece un intervallo di confidenza utilizzando un livello di confidenza del 95%:
Intervallo di confidenza al 95%: 70 +/- 1,96*(1,2/√25) = [69,5296, 70,4704]
Si noti che questo intervallo di confidenza è più ampio del precedente. Infatti, quanto più alto è il livello di confidenza, tanto più ampio è l’intervallo di confidenza.
Più alto è il livello di confidenza, più ampio è l’intervallo di confidenza.
Ciò dovrebbe avere un senso intuitivo: un livello di confidenza più ampio ha una maggiore probabilità di contenere un vero parametro della popolazione.
Riepilogo
In sintesi:
Un intervallo di confidenza è un intervallo di valori che probabilmente contiene un parametro della popolazione con un certo livello di confidenza. Utilizza la seguente formula base:
Intervallo di confidenza = (stima puntuale) +/- (valore critico)* (errore standard)
Il livello di confidenza determina il valore critico da utilizzare in questa formula. Più alto è il livello di confidenza, maggiore è il valore critico e quindi più ampio è l’intervallo di confidenza.
Risorse addizionali
Introduzione agli intervalli di confidenza
Introduzione al test di ipotesi
Cos’è una stima puntuale?