Correlazione vs. associazione: qual è la differenza?
Due termini a volte usati in modo intercambiabile sono correlazione e associazione . Tuttavia, nel campo della statistica, questi due termini hanno significati leggermente diversi.
In particolare, quando usiamo la parola correlazione , solitamente parliamo del coefficiente di correlazione di Pearson . È una misura dell’associazione lineare tra due variabili casuali X e Y. Ha un valore compreso tra -1 e 1 dove:
- -1 indica una correlazione lineare perfettamente negativa tra due variabili
- 0 indica alcuna correlazione lineare tra due variabili
- 1 indica una correlazione lineare perfettamente positiva tra due variabili
Al contrario, quando gli statistici usano la parola associazione , possono riferirsi a qualsiasi relazione tra due variabili, sia lineari che non lineari.
Per illustrare questa idea, consideriamo i seguenti esempi.
Visualizzazione di correlazione e associazione con nuvole di punti
Usiamo due parole per descrivere la correlazione tra due variabili casuali:
1 Direzione
- Positivo: due variabili casuali hanno una correlazione positiva se Y tende ad aumentare all’aumentare di X.
- Negativo: due variabili casuali hanno una correlazione negativa se Y tende a diminuire all’aumentare di X.
2. Forza
- Basso: due variabili casuali hanno una correlazione bassa se i punti in un grafico a dispersione sono scarsamente dispersi.
- Forte: due variabili casuali hanno una forte correlazione se i punti in un grafico a dispersione sono strettamente raggruppati insieme.
I seguenti grafici a dispersione illustrano esempi di ciascun tipo di correlazione:
Rispetto alla correlazione, la parola associazione può dirci se esiste o meno una relazione tra due variabili casuali: lineare o non lineare.
I seguenti grafici a dispersione illustrano alcuni esempi:
Il grafico a dispersione nell’angolo in alto a sinistra illustra una relazione quadratica tra due variabili casuali, il che significa che esiste un’associazione tra le due variabili ma non è lineare.
Se calcolassimo la correlazione tra le due variabili, probabilmente sarebbe prossima allo zero perché non esiste una relazione lineare tra loro.
Tuttavia, sapere semplicemente che la correlazione tra le due variabili è pari a zero può essere fuorviante perché nasconde il fatto che esiste invece una relazione non lineare.
Correlazione vs. associazione: una sintesi
I termini correlazione e associazione presentano le seguenti somiglianze e differenze:
Analogie:
- Entrambi i termini sono usati per descrivere se esiste o meno una relazione tra due variabili casuali.
- Entrambi i termini possono utilizzare grafici a dispersione per analizzare la relazione tra due variabili casuali.
Differenze:
- La correlazione può dirci solo se due variabili casuali hanno una relazione lineare mentre l’associazione può dirci se due variabili casuali hanno una relazione lineare o non lineare.
- La correlazione quantifica la relazione tra due variabili casuali utilizzando un numero compreso tra -1 e 1, ma l’associazione non utilizza un numero specifico per quantificare una relazione.
Risorse addizionali
Un’introduzione al coefficiente di correlazione di Pearson
Introduzione alle nuvole di punti
Correlazione vs regressione: qual è la differenza?