Intervallo di confidenza per un coefficiente di correlazione
Un intervallo di confidenza per un coefficiente di correlazione è un intervallo di valori che possono contenere un coefficiente di correlazione della popolazione con un certo livello di confidenza.
Questo tutorial spiega quanto segue:
- La motivazione per creare questo tipo di intervallo di confidenza.
- La formula per creare questo tipo di intervallo di confidenza.
- Un esempio di come creare questo tipo di intervallo di confidenza.
- Come interpretare questo tipo di intervallo di confidenza.
Intervallo di confidenza per un coefficiente di correlazione: motivazione
La ragione per creare un intervallo di confidenza per un coefficiente di correlazione è catturare la nostra incertezza quando si stima un coefficiente di correlazione della popolazione.
Ad esempio, supponiamo di voler stimare il coefficiente di correlazione tra altezza e peso dei residenti in una determinata contea. Poiché nella contea ci sono migliaia di residenti, sarebbe troppo costoso e dispendioso in termini di tempo andare in giro e raccogliere informazioni sull’altezza e sul peso di ciascun residente.
Invece, potremmo selezionare un semplice campione casuale di residenti e raccogliere semplicemente informazioni su di loro.
Poiché stiamo selezionando un campione casuale di residenti, non vi è alcuna garanzia che il coefficiente di correlazione tra l’altezza e il peso di questi residenti campionati corrisponda esattamente al coefficiente di correlazione della popolazione più ampia.
Quindi, per catturare questa incertezza, possiamo creare un intervallo di confidenza contenente un intervallo di valori che probabilmente conterranno il vero coefficiente di correlazione tra l’altezza e il peso dei residenti in quella contea.
Intervallo di confidenza per un coefficiente di correlazione: formula
Utilizziamo i seguenti passaggi per calcolare un intervallo di confidenza per un coefficiente di correlazione della popolazione, basato sulla dimensione del campione n e sul coefficiente di correlazione del campione r .
Passaggio 1: eseguire la trasformazione di Fisher.
Sia z r = ln((1+r) / (1-r)) / 2
Passaggio 2: trova i limiti superiore e inferiore del registro.
Sia L = z r – (z 1-α/2 /√ n-3 )
Sia U = z r + (z 1-α/2 /√ n-3 )
Passaggio 3: trovare l’intervallo di confidenza.
L’intervallo di confidenza finale può essere trovato utilizzando la seguente formula:
Intervallo di confidenza = [(e 2L -1)/(e 2L +1), (e 2U -1)/(e 2U +1)]
Intervallo di confidenza per un coefficiente di correlazione: esempio
Supponiamo di voler stimare il coefficiente di correlazione tra altezza e peso dei residenti di una determinata contea. Selezioniamo un campione casuale di 30 residenti e troviamo le seguenti informazioni:
- Dimensione del campione n = 30
- Coefficiente di correlazione tra altezza e peso r = 0,56
Ecco come trovare un intervallo di confidenza al 95% per il coefficiente di correlazione della popolazione:
Passaggio 1: eseguire la trasformazione di Fisher.
Sia z r = ln((1+r) / (1-r)) / 2 = ln((1+.56) / (1-.56)) / 2 = 0.6328
Passaggio 2: trova i limiti superiore e inferiore del registro.
Sia L = z r – (z 1-α/2 /√ n-3 ) = 0,6328 – (1,96 /√ 30-3 ) = 0,2556
Sia U = z r + (z 1-α/2 /√ n-3 ) = 0,6328 + (1,96 /√ 30-3 ) = 1,01
Passaggio 3: trovare l’intervallo di confidenza.
Intervallo di confidenza = [(e 2L -1)/(e 2L +1), (e 2U -1)/(e 2U +1)]
Intervallo di confidenza = [(e 2(.2556) -1)/(e 2(.2556) +1), (e 2(1.01) -1)/(e 2(1.01) +1)] = [. 2502, .7658]
Nota: è possibile trovare questo intervallo di confidenza anche utilizzando il calcolatore dell’intervallo di confidenza per un coefficiente di correlazione .
Intervallo di confidenza per un coefficiente di correlazione: interpretazione
Il modo in cui interpreteremmo un intervallo di confidenza è:
Esiste una probabilità del 95% che l’intervallo di confidenza di [.2502, .7658] contenga il vero coefficiente di correlazione della popolazione tra l’altezza e il peso dei residenti di quella contea.
Un altro modo per dire la stessa cosa è che c’è solo una probabilità del 5% che il vero coefficiente di correlazione della popolazione si trovi al di fuori dell’intervallo di confidenza del 95%.
Cioè, c’è solo una probabilità del 5% che il vero coefficiente di correlazione della popolazione tra l’altezza e il peso dei residenti di questa contea sia inferiore a 0,2502 o superiore a 0,7658.