Come creare una matrice di correlazione in fogli google


Un modo per quantificare la relazione tra due variabili è utilizzare il coefficiente di correlazione di Pearson , che è una misura dell’associazione lineare tra due variabili . Ha un valore compreso tra -1 e 1 dove:

  • -1 indica una correlazione lineare perfettamente negativa tra due variabili
  • 0 indica alcuna correlazione lineare tra due variabili
  • 1 indica una correlazione lineare perfettamente positiva tra due variabili

Quanto più il coefficiente di correlazione si allontana da zero, tanto più forte è la relazione tra le due variabili.

Ma in alcuni casi, vogliamo comprendere la correlazione tra più coppie di variabili. In questi casi, possiamo creare una matrice di correlazione , ovvero una tabella quadrata che mostra i coefficienti di correlazione tra diverse combinazioni di variabili a coppie.

Questo tutorial spiega come creare e interpretare una matrice di correlazione in Fogli Google.

Come creare una matrice di correlazione in Fogli Google

Supponiamo di avere il seguente set di dati che mostra il numero medio di punti, rimbalzi e assist per 10 giocatori di basket:

Per creare una matrice di correlazione per questo set di dati, possiamo utilizzare la funzione CORREL() con la seguente sintassi:

  COVAR(dati_y; dati_x)

La matrice di covarianza per questo set di dati è mostrata nelle celle B15:D17 mentre le formule utilizzate per creare la matrice di covarianza sono mostrate nelle celle B21:D23 di seguito:

Matrice di correlazione in Fogli Google

Come interpretare una matrice di correlazione

I valori nelle singole celle della matrice di correlazione ci dicono il coefficiente di correlazione di Pearson tra ciascuna combinazione di variabili a coppie. Per esempio:

Correlazione tra punti e rimbalzi: -0,0464. Punti e rimbalzi sono leggermente correlati negativamente, ma questo valore è così vicino allo zero che non vi è alcuna prova evidente di un’associazione significativa tra queste due variabili.

Correlazione tra punti e assist: 0,1219. Punti e assist sono leggermente correlati positivamente, ma questo valore è anche abbastanza vicino allo zero, quindi non esiste una forte evidenza di un’associazione significativa tra queste due variabili.

Correlazione tra rimbalzi e assist: 0,7137. Rimbalzi e assist sono fortemente correlati positivamente. Cioè, i giocatori che hanno più rimbalzi tendono anche ad avere più assist.

Da notare che i valori diagonali della matrice di correlazione sono tutti 1 perché la correlazione tra una variabile e se stessa è sempre 1. In pratica questo numero non è utile da interpretare.

Risorse addizionali

Come leggere una matrice di correlazione
Come creare una matrice di correlazione in Excel

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *