Come trovare il coefficiente di correlazione da r2


È possibile trovare il coefficiente di correlazione tra due variabili prendendo la radice quadrata del valore R al quadrato (R 2 ) di un semplice modello di regressione lineare.

Coefficiente di correlazione = √ R 2 del modello di regressione lineare semplice

Il segno del coefficiente di pendenza nel modello di regressione indica se il coefficiente di correlazione è positivo o negativo.

Gli esempi seguenti mostrano come trovare nella pratica il coefficiente di correlazione dal valore R quadrato di un modello di regressione.

Nota : il valore R quadrato di un modello di regressione è anche chiamato coefficiente di determinazione.

Esempio 1: trovare il coefficiente di correlazione da R 2 (quando la pendenza è positiva)

Supponiamo di adattare un semplice modello di regressione lineare utilizzando le ore studiate come variabile predittiva e i punteggi degli esami come variabile di risposta.

Supponiamo di ricevere il seguente output dal modello:

Equazione di regressione corretta : punteggio dell’esame = 65,55 + 2,78 (ore studiate)

R quadrato (R 2 ) del modello di regressione : 0,7845

Il valore R quadrato del modello ci dice quale percentuale di variazione nei punteggi degli esami può essere spiegata dalle ore studiate.

In questo esempio possiamo vedere che le ore studiate sono in grado di spiegare il 78,45% della variazione dei punteggi degli esami.

Per trovare il coefficiente di correlazione tra ore studiate e risultati degli esami, possiamo prendere la radice quadrata di R 2 :

Coefficiente di correlazione = √ R 2 = √ 0,7845 = 0,8857

Essendo il segno positivo per le ore studiate nell’equazione di regressione, questo coefficiente di correlazione è positivo.

Pertanto, il coefficiente di correlazione tra le ore studiate e il punteggio dell’esame è 0,8857 .

Esempio 2: trovare il coefficiente di correlazione da R 2 (quando la pendenza è negativa)

Supponiamo di adattare un semplice modello di regressione lineare utilizzando l’età (in anni) come variabile predittiva e la massima distensione su panca (in libbre) come variabile di risposta.

Supponiamo di ricevere il seguente output dal modello:

Equazione di regressione corretta : panca massima = 240,11 – 1,24 (età)

R quadrato (R 2 ) del modello di regressione : 0,4773

Il valore R quadrato del modello ci dice quale percentuale di variazione dei chili di picco nella distensione su panca può essere spiegata dall’età.

In questo esempio, possiamo vedere che l’età è in grado di spiegare il 47,73% della variazione della quantità massima di distensione su panca.

Per trovare il coefficiente di correlazione tra età e massima distensione su panca, possiamo prendere la radice quadrata di R 2 :

Coefficiente di correlazione = √ R 2 = √ 0,4773 = 0,6909

Poiché il segno dell’età è negativo nell’equazione di regressione, questo coefficiente di correlazione è negativo.

Pertanto, il coefficiente di correlazione tra età e distensione su panca massima è -0,6909 .

Risorse addizionali

Le esercitazioni seguenti forniscono informazioni aggiuntive sui coefficienti di correlazione:

Cos’è considerata una correlazione “forte”?
Quando dovresti usare la correlazione?
Come eseguire un test t di correlazione

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *