Cosa sono gli intervalli di confidenza?
Spesso nelle statistiche ci interessa misurare i parametri della popolazione , cioè numeri che descrivono determinate caratteristiche di un’intera popolazione.
Due dei parametri più comuni della popolazione sono:
1. Media della popolazione: il valore medio di una variabile in una popolazione (ad esempio, l’altezza media degli uomini negli Stati Uniti)
2. Proporzione della popolazione: la proporzione di una variabile in una popolazione (ad esempio, la percentuale di residenti in una contea che sostengono una determinata legge)
Anche se vogliamo misurare questi parametri, è generalmente troppo costoso e dispendioso in termini di tempo raccogliere dati su ciascun individuo di una popolazione per calcolare il parametro della popolazione.
Invece, in genere prendiamo un campione casuale della popolazione complessiva e utilizziamo i dati del campione per stimare il parametro della popolazione.
Ad esempio, supponiamo di voler stimare il peso medio di una determinata specie di tartaruga in Florida. Dato che ci sono migliaia di tartarughe in Florida, sarebbe estremamente dispendioso in termini di tempo e denaro andare in giro e pesare ciascuna tartaruga individualmente.
Invece, potremmo prendere un semplice campione casuale di 50 tartarughe e utilizzare il peso medio delle tartarughe in quel campione per stimare la vera media della popolazione:
Il problema è che non è garantito che il peso medio delle tartarughe nel campione corrisponda esattamente al peso medio delle tartarughe dell’intera popolazione. Ad esempio, potremmo scegliere un campione pieno di tartarughe di peso ridotto o magari un campione pieno di tartarughe pesanti.
Per catturare questa incertezza, possiamo creare un intervallo di confidenza. Un intervallo di confidenza è un intervallo di valori che probabilmente contiene un parametro della popolazione con un certo livello di confidenza. Si calcola secondo la seguente formula generale:
Intervallo di confidenza = (stima puntuale) +/- (valore critico)* (errore standard)
Questa formula crea un intervallo con un limite inferiore e un limite superiore, che probabilmente contiene un parametro della popolazione con un certo livello di confidenza.
Intervallo di confidenza = [limite inferiore, limite superiore]
Ad esempio, la formula per calcolare un intervallo di confidenza per la media della popolazione è:
Intervallo di confidenza = x +/- z*(s/√ n )
Oro:
- x : mezzi campione
- z: il valore z scelto
- s: deviazione standard campionaria
- n: dimensione del campione
Il valore z utilizzato dipende dal livello di confidenza scelto. La tabella seguente mostra il valore z che corrisponde alle scelte del livello di confidenza più comuni:
Un livello di fiducia | valore z |
---|---|
0,90 | 1.645 |
0,95 | 1,96 |
0,99 | 2.58 |
Ad esempio, supponiamo di raccogliere un campione casuale di tartarughe con le seguenti informazioni:
- Dimensione del campione n = 25
- Peso medio del campione x = 300
- Deviazione standard del campione s = 18,5
Ecco come calcolare l’intervallo di confidenza al 90% per il peso medio della popolazione reale:
Intervallo di confidenza al 90%: 300 +/- 1,645*(18,5/√25) = [293,91, 306,09]
Interpretiamo questo intervallo di confidenza come segue:
Esiste una probabilità del 90% che l’intervallo di confidenza di [293,91, 306,09] contenga il vero peso medio della popolazione di tartarughe.
Un altro modo per dire la stessa cosa è che c’è solo una probabilità del 10% che la media della popolazione reale si trovi al di fuori dell’intervallo di confidenza del 90%. Cioè, c’è solo una probabilità del 10% che il peso medio effettivo della popolazione di tartarughe sia maggiore di 306,09 libbre o inferiore a 293,91 libbre.
Non vale nulla che ci siano due numeri che possono influenzare la dimensione di un intervallo di confidenza:
1. Dimensione del campione: maggiore è la dimensione del campione, più stretto è l’intervallo di confidenza.
2. Il livello di confidenza: maggiore è il livello di confidenza, più ampio è l’intervallo di confidenza.
Tipi di intervalli di confidenza
Esistono molti tipi di intervalli di confidenza. Ecco quelli più comunemente usati:
Intervallo di confidenza per una media
Un intervallo di confidenza per una media è un intervallo di valori che probabilmente contiene la media della popolazione con un certo livello di confidenza. La formula per calcolare questo intervallo è la seguente:
Intervallo di confidenza = x +/- z*(s/√ n )
Oro:
- x : media campionaria
- z: il valore z scelto
- s: deviazione standard campionaria
- n: dimensione del campione
Risorse:
Come calcolare un intervallo di confidenza per una media
Intervallo di confidenza per un calcolatore medio
Intervallo di confidenza per la differenza tra medie
Un intervallo di confidenza (CI) per una differenza tra medie è un intervallo di valori che probabilmente contiene la vera differenza tra due medie della popolazione con un certo livello di confidenza. La formula per calcolare questo intervallo è la seguente:
Intervallo di confidenza = ( x 1 – x 2 ) +/- t*√((s p 2 /n 1 ) + (s p 2 /n 2 ))
Oro:
- x 1 , x 2 : media del campione 1, media del campione 2
- t: il valore t-critico basato sul livello di confidenza e (n 1 + n 2 -2) gradi di libertà
- s p 2 : varianza aggregata
- n1 , n2 : dimensione del campione 1, dimensione del campione 2
Oro:
- La varianza aggregata viene calcolata come segue: s p 2 = ((n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2)
- Il valore t-critico t può essere trovato utilizzando il calcolatore della distribuzione t inversa.
Risorse:
Come calcolare un intervallo di confidenza per la differenza tra medie
Calcolatore dell’intervallo di confidenza per la differenza tra le medie
Intervallo di confidenza per una proporzione
Un intervallo di confidenza per una proporzione è un intervallo di valori che probabilmente contiene una proporzione della popolazione con un certo livello di confidenza. La formula per calcolare questo intervallo è la seguente:
Intervallo di confidenza = p +/- z*(√ p(1-p) / n )
Oro:
- p: proporzione del campione
- z: il valore z scelto
- n: dimensione del campione
Risorse:
Come calcolare un intervallo di confidenza per una proporzione
Intervallo di confidenza per un calcolatore di proporzioni
Intervallo di confidenza per la differenza nelle proporzioni
Un intervallo di confidenza per la differenza nelle proporzioni è un intervallo di valori che può contenere la vera differenza tra due proporzioni di popolazione con un certo livello di confidenza. La formula per calcolare questo intervallo è la seguente:
Intervallo di confidenza = (p 1 –p 2 ) +/- z*√(p 1 (1-p 1 )/n 1 + p 2 (1-p 2 )/n 2 )
Oro:
- p 1 , p 2 : proporzione del campione 1, proporzione del campione 2
- z: il valore z-critico basato sul livello di confidenza
- n1 , n2 : dimensione del campione 1, dimensione del campione 2
Risorse:
Come calcolare un intervallo di confidenza per la differenza nelle proporzioni
Intervallo di confidenza per il calcolatore della differenza nelle proporzioni