Cos'è la correlazione di ordine zero?
In statistica, la correlazione tra due variabili ci racconta la relazione tra queste due variabili.
Uno dei tipi più basilari di correlazione è noto come correlazione di ordine zero , che si riferisce alla correlazione tra due variabili senza controllare la possibile influenza di altre variabili.
Un esempio di questo tipo di correlazione è il coefficiente di correlazione di Pearson , che misura l’associazione lineare tra due variabili e può assumere valori compresi tra -1 e 1 dove:
- -1 indica una correlazione lineare perfettamente negativa tra due variabili
- 0 indica alcuna correlazione lineare tra due variabili
- 1 indica una correlazione lineare perfettamente positiva tra due variabili
Quanto più la correlazione si allontana da zero, tanto più forte è l’associazione tra le due variabili.
Correlazioni del primo e del secondo ordine
Se calcoliamo la correlazione tra due variabili A e B controllando l’influenza di una terza variabile C, chiameremo la correlazione tra A e B una correlazione di primo ordine .
Allo stesso modo, se calcoliamo la correlazione tra due variabili A e B controllando l’influenza delle variabili C e D, chiameremo la correlazione tra A e B una correlazione di secondo ordine .
Esempio di correlazione di ordine zero
Supponiamo di avere il seguente set di dati che mostra il numero di ore trascorse a studiare e il voto ottenuto all’esame da 10 studenti diversi:
Risulta che la correlazione tra queste due variabili è 0,762 . Questa sarebbe considerata una correlazione di ordine zero tra le due variabili, poiché non controlliamo la potenziale influenza di una terza variabile.
Tuttavia, in realtà, è possibile che altri fattori influenzino il rapporto tra queste due variabili.
Ad esempio, il voto attuale dello studente nella classe potrebbe avere un effetto sul punteggio dell’esame. Supponiamo di avere accesso anche a questi dati:
Se poi calcolassimo la correlazione tra ore ed esame controllando l’effetto del voto corrente , scopriremmo che la correlazione di primo ordine tra ore ed esame è 0,578 .
Ciò significa che esiste ancora una correlazione positiva abbastanza forte tra le ore studiate e il voto dell’esame, anche dopo aver controllato l’effetto del voto attuale dello studente nella classe.
Nota: la correlazione del primo ordine è talvolta chiamata correlazione parziale . Questo tutorial spiega come calcolare le correlazioni parziali in Excel.
Correlazioni di ordine zero in una matrice di correlazione
creiamo una matrice di correlazione Ogni volta che per un insieme di variabili, i coefficienti di correlazione visualizzati nella matrice sono sempre correlazioni di ordine zero perché sono semplicemente le correlazioni tra ciascuna combinazione di variabili a coppie senza considerare l’influenza di altre variabili.
Ad esempio, considera il nostro set di dati dell’esempio precedente:
Se creassimo una matrice di correlazione per questo set di dati, sarebbe simile a questa:
Il modo di interpretarlo è:
- La correlazione tra voto attuale e ore studiate è 0,689 .
- La correlazione tra il punteggio attuale e il punteggio ottenuto all’esame è 0,637 .
- La correlazione tra ore studiate e voto dell’esame è 0,762 .
Ognuna di queste correlazioni è una correlazione di ordine zero .
Risorse addizionali
Le seguenti esercitazioni forniscono ulteriori informazioni sui coefficienti di correlazione:
Introduzione al coefficiente di correlazione di Pearson
Come leggere una matrice di correlazione
Come calcolare la correlazione parziale in Excel