Intervallo di stima
Questo articolo spiega cos’è la stima intervallare nelle statistiche. Imparerai anche come viene eseguita la stima per intervallo e, infine, in che modo la stima per intervallo differisce dalla stima per punto.
Cos’è la stima intervallare?
In statistica, la stima per intervallo è un processo in cui il valore di un parametro della popolazione viene stimato utilizzando un intervallo. Più precisamente, la stima per intervallo implica il calcolo dell’intervallo in cui è più probabile che il valore del parametro si trovi con un certo livello di confidenza .
Ad esempio, se in una stima per intervallo arriviamo alla conclusione che l’intervallo di confidenza per la media della popolazione è (3,7) con un livello di confidenza del 95%, ciò significa che la media della popolazione studiata sarà compresa tra 3 e 7 con un probabilità del 95%.
In generale, la dimensione di una popolazione è troppo grande per poter studiare tutti i suoi individui, quindi il valore delle sue misurazioni statistiche non può essere conosciuto con certezza, ma piuttosto con approssimazione.
Pertanto, la stima intervallare viene utilizzata per fornire, sulla base dei dati campione, un’approssimazione dell’intervallo di valori entro il quale si trova il parametro della popolazione. In questo modo, il valore del parametro della popolazione può essere stimato a partire dai dati studiati da un campione.
Infine, per comprendere appieno il significato della stima intervallare, è necessario avere ben chiaro il concetto di intervallo di confidenza. Un intervallo di confidenza è l’intervallo che fornisce, con un margine di errore, un’approssimazione dei valori tra i quali si trova il valore di un parametro della popolazione. Pertanto, l’intervallo di confidenza è il risultato ottenuto da una stima intervallare.
Formule di stima intervallare
Di seguito troverai le diverse formule per la stima degli intervalli di confidenza, poiché a seconda che tu voglia stimare l’intervallo di confidenza per la media, per la varianza o per la proporzione, la formula da utilizzare è diversa.
Intervallo di confidenza per la media
Supponendo che il processo di immissione di una variabile proceda in questo modo:
L’intervallo di confidenza per la media viene calcolato aggiungendo e sottraendo dalla media campionaria il valore di Z α/2 moltiplicato per la deviazione standard (σ) e diviso per la radice quadrata della dimensione del campione (n). Pertanto la formula per calcolare l’intervallo di confidenza della media è:
Per campioni di grandi dimensioni e livello di confidenza del 95%, il valore critico è Z α/2 = 1,96 e per il livello di confidenza del 99%, il valore critico è Z α/2 = 2,576.
La formula precedente viene utilizzata quando è nota la varianza della popolazione. Tuttavia, se la varianza della popolazione non è nota, che è il caso più comune, l’intervallo di confidenza per la media viene calcolato utilizzando la seguente formula:
Oro:
-
è la media del campione.
-
è il valore della distribuzione t di Student di n-1 gradi di libertà con una probabilità di α/2.
-
è la deviazione standard del campione.
-
è la dimensione del campione.
Intervallo di confidenza per la varianza
Per calcolare l’intervallo di confidenza per la varianza di una popolazione, viene utilizzata la distribuzione chi quadrato. Più specificamente, la formula per calcolare l’intervallo di confidenza per la varianza è:
Oro:
-
è la dimensione del campione.
-
è la deviazione standard del campione.
-
è il valore della distribuzione Chi-quadrato con n-1 gradi di libertà per una probabilità inferiore a α/2.
-
è il valore della distribuzione Chi-quadrato con n-1 gradi di libertà per una probabilità maggiore di 1-α/2.
Intervallo di confidenza per la proporzione
L’intervallo di confidenza per la proporzione viene calcolato aggiungendo e sottraendo dalla proporzione campionaria il valore di Z α/2 moltiplicato per la radice quadrata della proporzione campionaria (p) moltiplicata per 1-p e divisa per la dimensione del campione (n). Pertanto, la formula per calcolare l’intervallo di confidenza per la proporzione è:
Oro:
-
è la proporzione campionaria.
-
è la dimensione del campione.
-
è il quantile della distribuzione normale standard corrispondente a una probabilità di α/2. Per campioni di grandi dimensioni e un livello di confidenza del 95% è solitamente vicino a 1,96 mentre per un livello di confidenza del 99% è solitamente vicino a 2,576.
Stima intervallare e stima puntuale
Infine, vedremo quali sono le differenze tra stima intervallare e stima puntuale, poiché il valore di un parametro della popolazione può essere stimato utilizzando un intervallo (come abbiamo visto in tutto l’articolo) oppure tramite un valore puntuale.
La differenza tra stima intervallare e stima puntuale è l’intervallo di valori utilizzato nella stima dei parametri. Nella stima intervallare, un parametro viene approssimato a un intervallo di confidenza, mentre nella stima puntuale, il parametro viene approssimato a un valore specifico.
Pertanto, nella stima puntuale, un singolo valore, calcolato dai dati del campione, è considerato un’approssimazione del valore del parametro della popolazione. Ad esempio, la media della popolazione può essere stimata con precisione utilizzando la media campionaria.
Pertanto, la stima puntuale presenta vantaggi e svantaggi rispetto alla stima intervallare, in modo tale che ciascun tipo di stima è appropriato per l’uso in una determinata situazione. Per saperne di più clicca sul seguente link: