Intervallo di confidenza per la differenza tra medie


Un intervallo di confidenza (CI) per una differenza tra medie è un intervallo di valori che probabilmente contiene la vera differenza tra due medie della popolazione con un certo livello di confidenza.

Questo tutorial spiega quanto segue:

  • La motivazione per creare questo intervallo di confidenza.
  • La formula per creare questo intervallo di confidenza.
  • Un esempio di come calcolare questo intervallo di confidenza.
  • Come interpretare questo intervallo di confidenza.

CI per la differenza tra mezzi: motivazione

I ricercatori spesso vogliono stimare la differenza tra le medie di due popolazioni. Per stimare questa differenza, raccoglieranno un campione casuale da ciascuna popolazione e calcoleranno la media per ciascun campione. Quindi possono confrontare la differenza tra le due medie.

Tuttavia, non possono sapere con certezza se la differenza tra le medie campionarie corrisponde alla vera differenza tra le medie della popolazione. Questo è il motivo per cui possono creare un intervallo di confidenza per la differenza tra le due medie. Ciò fornisce un intervallo di valori che probabilmente conterrà la vera differenza tra le medie della popolazione.

Ad esempio, supponiamo di voler stimare la differenza di peso medio tra due diverse specie di tartarughe. Dato che ci sono migliaia di tartarughe in ogni popolazione, sarebbe troppo dispendioso in termini di tempo e denaro andare in giro e pesare ciascuna tartaruga individualmente.

Invece, potremmo prendere un semplice campione casuale di 15 tartarughe da ciascuna popolazione e utilizzare il peso medio di ciascun campione per stimare la vera differenza nel peso medio tra le due popolazioni:

Intervallo di confidenza per la differenza tra le medie di due popolazioni

Il problema è che i nostri campioni sono casuali, quindi non è garantito che la differenza di peso medio tra i due campioni corrisponda esattamente alla differenza di peso medio tra le due popolazioni. Quindi, per catturare questa incertezza, possiamo creare un intervallo di confidenza contenente un intervallo di valori che possano contenere la vera differenza di peso medio tra le due popolazioni.

CI per la differenza tra medie: formula

Usiamo la seguente formula per calcolare un intervallo di confidenza per la differenza tra due medie:

Intervallo di confidenza = ( x 1x 2 ) +/- t*√((s p 2 /n 1 ) + (s p 2 /n 2 ))

Oro:

  • x 1 , x 2 : media del campione 1, media del campione 2
  • t: il valore t-critico basato sul livello di confidenza e (n 1 + n 2 -2) gradi di libertà
  • s p 2 : varianza aggregata
  • n1 , n2 : dimensione del campione 1, dimensione del campione 2

Oro:

  • La varianza aggregata viene calcolata come segue: s p 2 = ((n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2)
  • Il valore t-critico t può essere trovato utilizzando il calcolatore della distribuzione t inversa.

CI per la differenza tra medie: esempio

Supponiamo di voler stimare la differenza di peso medio tra due diverse specie di tartarughe. Raccoglieremo quindi un campione casuale di 15 tartarughe da ciascuna popolazione. Ecco i dati riepilogativi per ciascun campione:

Esempio 1:

  • x1 = 310
  • s1 = 18,5
  • n1 = 15

Esempio 2:

  • x2 = 300
  • s2 = 16,4
  • n2 = 15

Ecco come trovare diversi intervalli di confidenza per la vera differenza nei pesi medi della popolazione:

Intervallo di confidenza al 90%:

(310-300) +/- 1,70*√((305,61/15) + (305,61/15)) = [-0,8589, 20,8589]

Intervallo di confidenza al 95%:

(310-300) +/- 2,05*√((305,61/15) + (305,61/15)) = [-3,0757, 23,0757]

Intervallo di confidenza al 99%:

(310-300) +/- 2,76*√((305,61/15) + (305,61/15)) = [-7,6389, 27,6389]

Nota: è possibile trovare questi intervalli di confidenza anche utilizzando il calcolatore dell’intervallo di confidenza statistica per la differenza tra le medie .

Noterai che maggiore è il livello di confidenza, più ampio è l’intervallo di confidenza. Ciò dovrebbe avere senso, poiché è più probabile che intervalli più ampi contengano la media reale della popolazione, quindi siamo più “fiduciosi” che l’intervallo contenga la media reale della popolazione.

CI per la differenza tra medie : interpretazione

Il modo in cui interpreteremmo un intervallo di confidenza è:

Esiste una probabilità del 95% che l’intervallo di confidenza di [-3,0757, 23,0757] contenga la vera differenza di peso medio tra le due popolazioni di tartarughe.

Poiché questo intervallo contiene il valore “0”, ciò significa che è possibile che non vi sia alcuna differenza di peso medio tra le tartarughe di queste due popolazioni. In altre parole, non possiamo affermare con una sicurezza del 95% che esista una differenza di peso medio tra le tartarughe di queste due popolazioni.

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *