Intervallo di confidenza per la differenza nelle proporzioni


Un intervallo di confidenza (CI) per una differenza nelle proporzioni è un intervallo di valori che probabilmente contiene la vera differenza tra due proporzioni di popolazione con un certo livello di confidenza.

Questo tutorial spiega quanto segue:

  • La motivazione per creare questo intervallo di confidenza.
  • La formula per creare questo intervallo di confidenza.
  • Un esempio di come calcolare questo intervallo di confidenza.
  • Come interpretare questo intervallo di confidenza.

CI per la differenza di proporzioni: motivazione

I ricercatori spesso vogliono stimare la differenza tra due proporzioni di popolazione. Per stimare questa differenza, raccoglieranno un campione casuale da ciascuna popolazione e calcoleranno la proporzione per ciascun campione. Quindi possono confrontare la differenza tra le due proporzioni.

Tuttavia, non possono sapere con certezza se la differenza tra le proporzioni del campione corrisponde alla vera differenza tra le proporzioni della popolazione. Questo è il motivo per cui possono creare un intervallo di confidenza per la differenza tra le due proporzioni. Ciò fornisce un intervallo di valori che possono contenere la vera differenza tra le proporzioni della popolazione.

Ad esempio, supponiamo di voler stimare la differenza tra la proporzione di residenti che sostengono una determinata legge nella Contea A e la proporzione di residenti che sostengono la legge nella Contea B.

Dato che ci sono migliaia di residenti in ogni contea, sarebbe troppo dispendioso in termini di tempo e denaro andare in giro ed esaminare ogni singolo residente in ciascuna contea.

Invece, potremmo prendere un semplice campione casuale di residenti di ciascuna contea e utilizzare la proporzione a favore della legge in ciascun campione per stimare la vera differenza nelle proporzioni tra le due contee:

Poiché i nostri campioni sono casuali, non è garantito che la differenza nelle proporzioni tra i due campioni corrisponda esattamente alla differenza nelle proporzioni tra le due popolazioni. Quindi, per catturare questa incertezza, possiamo creare un intervallo di confidenza contenente un intervallo di valori suscettibili di contenere la vera differenza nelle proporzioni tra le due popolazioni.

CI per la differenza di proporzioni: formula

Usiamo la seguente formula per calcolare un intervallo di confidenza per una differenza tra due proporzioni di popolazione:

Intervallo di confidenza = (p 1 –p 2 ) +/- z*√(p 1 (1-p 1 )/n 1 + p 2 (1-p 2 )/n 2 )

Oro:

  • p 1 , p 2 : proporzione del campione 1, proporzione del campione 2
  • z: il valore z-critico basato sul livello di confidenza
  • n1 , n2 : dimensione del campione 1, dimensione del campione 2

Il valore z utilizzato dipende dal livello di confidenza scelto. La tabella seguente mostra il valore z che corrisponde alle scelte del livello di confidenza più comuni:

Un livello di fiducia valore z
0,90 1.645
0,95 1,96
0,99 2.58

Si noti che livelli di confidenza più elevati corrispondono a valori z più grandi, il che porta a intervalli di confidenza più ampi. Ciò significa che, ad esempio, un intervallo di confidenza al 95% sarà più ampio di un intervallo di confidenza al 90% per lo stesso set di dati.

CI per la differenza di proporzioni: esempio

Supponiamo di voler stimare la differenza tra la percentuale di residenti che sostengono una determinata legge nella contea A rispetto alla proporzione che sostiene la legge nella contea B. Ecco i dati riepilogativi per ciascun campione:

Esempio 1:

  • n1 = 100
  • p 1 = 0,62 (ovvero 62 abitanti su 100 sostengono la legge)

Esempio 2:

  • n2 = 100
  • p 2 = 0,46 (ovvero 46 abitanti su 100 sostengono la legge)

Ecco come trovare diversi intervalli di confidenza per la differenza nelle proporzioni della popolazione:

Intervallo di confidenza al 90%:

(0,62-0,46) +/- 1,645*√(0,62(1-0,62)/100 + 0,46(1-0,46)/100) = [0,0456, 0,2744]

Intervallo di confidenza al 95%:

(0,62-0,46) +/- 1,96*√(0,62(1-0,62)/100 + 0,46(1-0,46)/100) = [0,0236, 0,2964]

Intervallo di confidenza al 99%:

(0,62-0,46) +/- 2,58*√(0,62(1-0,62)/100 + 0,46(1-0,46)/100) = [-0,0192, 0,3392]

Nota: puoi anche trovare questi intervalli di confidenza utilizzando il calcolatore dell’intervallo di confidenza per la differenza di proporzioni .

CI per la differenza di proporzioni : interpretazione

Il modo in cui interpreteremmo un intervallo di confidenza è:

C’è una probabilità del 95% che l’intervallo di confidenza di [.0236, .2964] contenga la vera differenza nella percentuale di residenti che sostengono la legge tra le due contee.

Poiché questo intervallo non contiene il valore “0”, ciò significa che è molto probabile che vi sia una reale differenza nella percentuale di residenti che sostengono questa legge nella contea A rispetto alla contea B.

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *