Correlazione vs. associazione: qual è la differenza?


Due termini a volte usati in modo intercambiabile sono correlazione e associazione . Tuttavia, nel campo della statistica, questi due termini hanno significati leggermente diversi.

In particolare, quando usiamo la parola correlazione , solitamente parliamo del coefficiente di correlazione di Pearson . È una misura dell’associazione lineare tra due variabili casuali X e Y. Ha un valore compreso tra -1 e 1 dove:

  • -1 indica una correlazione lineare perfettamente negativa tra due variabili
  • 0 indica alcuna correlazione lineare tra due variabili
  • 1 indica una correlazione lineare perfettamente positiva tra due variabili

Al contrario, quando gli statistici usano la parola associazione , possono riferirsi a qualsiasi relazione tra due variabili, sia lineari che non lineari.

Per illustrare questa idea, consideriamo i seguenti esempi.

Visualizzazione di correlazione e associazione con nuvole di punti

Usiamo due parole per descrivere la correlazione tra due variabili casuali:

1 Direzione

  • Positivo: due variabili casuali hanno una correlazione positiva se Y tende ad aumentare all’aumentare di X.
  • Negativo: due variabili casuali hanno una correlazione negativa se Y tende a diminuire all’aumentare di X.

2. Forza

  • Basso: due variabili casuali hanno una correlazione bassa se i punti in un grafico a dispersione sono scarsamente dispersi.
  • Forte: due variabili casuali hanno una forte correlazione se i punti in un grafico a dispersione sono strettamente raggruppati insieme.

I seguenti grafici a dispersione illustrano esempi di ciascun tipo di correlazione:

Rispetto alla correlazione, la parola associazione può dirci se esiste o meno una relazione tra due variabili casuali: lineare o non lineare.

I seguenti grafici a dispersione illustrano alcuni esempi:

Correlazione vs associazione

Il grafico a dispersione nell’angolo in alto a sinistra illustra una relazione quadratica tra due variabili casuali, il che significa che esiste un’associazione tra le due variabili ma non è lineare.

Se calcolassimo la correlazione tra le due variabili, probabilmente sarebbe prossima allo zero perché non esiste una relazione lineare tra loro.

Tuttavia, sapere semplicemente che la correlazione tra le due variabili è pari a zero può essere fuorviante perché nasconde il fatto che esiste invece una relazione non lineare.

Correlazione vs. associazione: una sintesi

I termini correlazione e associazione presentano le seguenti somiglianze e differenze:

Analogie:

  • Entrambi i termini sono usati per descrivere se esiste o meno una relazione tra due variabili casuali.
  • Entrambi i termini possono utilizzare grafici a dispersione per analizzare la relazione tra due variabili casuali.

Differenze:

  • La correlazione può dirci solo se due variabili casuali hanno una relazione lineare mentre l’associazione può dirci se due variabili casuali hanno una relazione lineare o non lineare.
  • La correlazione quantifica la relazione tra due variabili casuali utilizzando un numero compreso tra -1 e 1, ma l’associazione non utilizza un numero specifico per quantificare una relazione.

Risorse addizionali

Un’introduzione al coefficiente di correlazione di Pearson
Introduzione alle nuvole di punti
Correlazione vs regressione: qual è la differenza?

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *