Intervallo di confidenza
Questo articolo spiega cos’è un intervallo di confidenza nelle statistiche e a cosa serve. Troverai anche i fattori che influenzano gli intervalli di confidenza e come viene calcolato un intervallo di confidenza.
Cos’è un intervallo di confidenza?
In statistica, l’ intervallo di confidenza è un intervallo che fornisce un’approssimazione dei valori tra i quali il valore di un parametro della popolazione si lega ad un certo livello di confidenza. Gli intervalli di confidenza più comuni hanno un livello di confidenza del 95% o 99%.
Ad esempio, se l’intervallo di confidenza per la media di una popolazione con un livello di confidenza del 95% è (3,7), ciò significa che la media della popolazione studiata sarà compresa tra 3 e 7 con una probabilità del 95%.
Pertanto, l’intervallo di confidenza viene utilizzato per stimare due valori tra i quali si trova un parametro della popolazione. Generalmente i valori dei parametri della popolazione non sono noti, quindi dai dati presenti in un campione viene calcolato un intervallo di confidenza per avere una stima dei parametri della popolazione.
Fattori che influenzano l’intervallo di confidenza
Una volta vista la definizione di intervallo di confidenza, vedremo quali sono i fattori da cui dipendono gli intervalli di confidenza per comprendere meglio il concetto.
- Dimensione del campione : il numero di osservazioni studiate influenza la precisione dell’intervallo di confidenza, poiché più dati abbiamo, più un valore può essere stimato. In generale, maggiore è la dimensione del campione, minore è l’ampiezza dell’intervallo di confidenza.
- Margine di errore : maggiore è l’errore consentito, maggiore è l’intervallo di confidenza e quindi maggiore è la probabilità che il valore reale del parametro rientri nell’intervallo di confidenza. Tuttavia, il margine di errore diminuisce la precisione dell’intervallo di confidenza.
- Livello di confidenza : è la probabilità che la stima della statistica della popolazione rientri nell’intervallo di confidenza. Tipicamente, il livello di confidenza di un intervallo è indicato come 1-α ed è espresso in percentuale. Un livello di confidenza elevato aumenta la probabilità che il valore vero sia compreso tra i limiti dell’intervallo, ma aumenta anche l’ampiezza dell’intervallo.
- Il parametro stimato : l’intervallo di confidenza dipende dal parametro da approssimare. Infatti la formula da utilizzare per calcolare l’intervallo di confidenza dipende dal parametro approssimativo.
Come calcolare l’intervallo di confidenza
Di seguito viene presentata la formula da applicare per calcolare ciascun tipo di intervallo di confidenza, poiché a seconda che si voglia determinare l’intervallo di confidenza per la media, la varianza o la proporzione, la formula da utilizzare è diversa.
Intervallo di confidenza per la media
A partire dal fatto che il processo di digitazione di una variabile si svolge come segue:
L’intervallo di confidenza per la media viene calcolato aggiungendo e sottraendo dalla media campionaria il valore di Z α/2 moltiplicato per la deviazione standard (σ) e diviso per la radice quadrata della dimensione del campione (n). Pertanto la formula per calcolare l’intervallo di confidenza della media è:
Per campioni di grandi dimensioni e livello di confidenza del 95%, il valore critico è Z α/2 = 1,96 e per il livello di confidenza del 99%, il valore critico è Z α/2 = 2,576.
La formula precedente viene utilizzata quando è nota la varianza della popolazione. Tuttavia, se la varianza della popolazione non è nota, che è il caso più comune, l’intervallo di confidenza per la media viene calcolato utilizzando la seguente formula:
Oro:
-
è la media del campione.
-
è il valore della distribuzione t di Student di n-1 gradi di libertà con probabilità α/2.
-
è la deviazione standard del campione.
-
è la dimensione del campione.
Intervallo di confidenza per la varianza
Per calcolare l’intervallo di confidenza per la varianza di una popolazione, viene utilizzata la distribuzione chi quadrato. Più specificamente, la formula per calcolare l’intervallo di confidenza per la varianza è:
Oro:
-
è la dimensione del campione.
-
è la deviazione standard del campione.
-
è il valore della distribuzione Chi-quadrato con n-1 gradi di libertà per una probabilità inferiore a α/2.
-
è il valore della distribuzione Chi-quadrato con n-1 gradi di libertà per una probabilità maggiore di 1-α/2.
Intervallo di confidenza per la proporzione
L’intervallo di confidenza per la proporzione viene calcolato aggiungendo e sottraendo dalla proporzione campionaria il valore di Z α/2 moltiplicato per la radice quadrata della proporzione campionaria (p) moltiplicata per 1-p e divisa per la dimensione del campione (n). Pertanto, la formula per calcolare l’intervallo di confidenza per la proporzione è:
Oro:
-
è la proporzione campionaria.
-
è la dimensione del campione.
-
è il quantile della distribuzione normale standard corrispondente a una probabilità di α/2. Per campioni di grandi dimensioni e un livello di confidenza del 95% è solitamente vicino a 1,96 mentre per un livello di confidenza del 99% è solitamente vicino a 2,576.