Ciò che è considerato un “debole”; correlazione?


Nelle statistiche, spesso cerchiamo di capire come due variabili si relazionano tra loro. Ad esempio, potremmo voler sapere:

  • Qual è la relazione tra il numero di ore di studio di uno studente e il voto che ottiene all’esame?
  • Qual è la relazione tra la temperatura esterna e il numero di barrette di gelato vendute da un food truck?
  • Qual è la relazione tra i dollari spesi in pubblicità e le entrate totali guadagnate per una determinata attività?

In ogni scenario, vogliamo comprendere la relazione tra due variabili.

Uno dei modi più comuni per quantificare una relazione tra due variabili è utilizzare il coefficiente di correlazione di Pearson , che è una misura dell’associazione lineare tra due variabili.

Assume sempre un valore compreso tra -1 e 1 dove:

  • -1 indica una correlazione lineare perfettamente negativa tra due variabili
  • 0 indica alcuna correlazione lineare tra due variabili
  • 1 indica una correlazione lineare perfettamente positiva tra due variabili

Spesso indicato con r , questo numero ci aiuta a comprendere la forza della relazione tra due variabili. Più r è vicino a zero, più debole è la relazione tra le due variabili .

È importante notare che due variabili possono avere una correlazione positiva debole o una correlazione negativa debole.

Correlazione positiva debole: quando una variabile aumenta, anche l’altra variabile tende ad aumentare, ma solo debolmente o in modo inaffidabile.

Esempio di correlazione positiva debole

Correlazione negativa bassa: quando una variabile aumenta, l’altra variabile tende a diminuire, ma solo debolmente o in modo inaffidabile.

Esempio di correlazione negativa debole

La tabella seguente mostra la regola pratica per interpretare la forza della relazione tra due variabili in base al valore di r :

Valore assoluto di r Forza della relazione
r < 0,25 Nessuna relazione
0,25 < r < 0,5 Relazione debole
0,5 < r < 0,75 Relazioni moderate
r > 0,75 Relazioni forti

La correlazione tra due variabili è considerata bassa se il valore assoluto di r è compreso tra 0,25 e 0,5.

Tuttavia, la definizione di correlazione “debole” può variare da campo a campo.

Medico

In campo medico, la definizione di relazione “debole” è spesso molto più bassa. Se il rapporto tra l’assunzione di un determinato farmaco e la riduzione degli attacchi cardiaci è r = 0,2, questo potrebbe essere considerato “nessun rapporto” in altri campi, ma in medicina è abbastanza significativo che vale la pena assumere il medicinale per ridurre il rischio di attacchi cardiaci . Avere un infarto.

Risorse umane

In un campo come quello delle risorse umane, anche le correlazioni più basse vengono utilizzate più spesso. Ad esempio, è stato dimostrato che la correlazione tra GPA universitario e rendimento lavorativo è pari a circa r = 0,16 . È un valore piuttosto basso, ma è abbastanza importante che un’azienda lo consideri almeno durante un processo di intervista.

Tecnologia

Nei campi tecnologici, potrebbe essere necessario che la correlazione tra le variabili sia molto più elevata per essere considerata “bassa”. Ad esempio, se un’azienda crea un’auto a guida autonoma e la correlazione tra le decisioni di svolta dell’auto e la probabilità di evitare un incidente è r = 0,95 , questa può essere considerata una correlazione “debole” ed è probabilmente troppo debole perché l’auto possa essere considerato sicuro, perché una decisione sbagliata può essere fatale.

Utilizza i grafici a dispersione per visualizzare le correlazioni

Quando si calcola il coefficiente di correlazione tra due variabili, è utile creare un grafico a dispersione per visualizzare anche la correlazione.

In particolare, le nuvole di punti offrono due vantaggi:

1. I grafici a dispersione possono aiutarti a identificare i valori anomali che influenzano il coefficiente di correlazione.

Un valore anomalo estremo può avere un grande impatto sul coefficiente di correlazione. Considera l’esempio seguente, in cui le variabili X e Y hanno un coefficiente di correlazione di Pearson di r = 0,91 .

Ora immaginiamo di modificare il primo punto dati in modo che sia molto più grande. Il coefficiente di correlazione diventa improvvisamente r = 0,29 .

Questo singolo punto dati modifica il coefficiente di correlazione da una relazione fortemente positiva a una relazione debolmente positiva.

(2) I grafici a dispersione possono aiutarti a identificare le relazioni non lineari tra le variabili.

Un coefficiente di correlazione di Pearson ci dice semplicemente se due variabili sono linearmente correlate. Ma anche se un coefficiente di correlazione di Pearson ci dice che due variabili non sono correlate, potrebbero comunque avere una sorta di relazione non lineare.

Ad esempio, considera il grafico a dispersione riportato di seguito tra le variabili X e Y , in cui la loro correlazione è r = 0,00 .

Le variabili chiaramente non hanno una relazione lineare, ma hanno una relazione non lineare: i valori y sono semplicemente i valori x al quadrato.

Un coefficiente di correlazione da solo non è in grado di rilevare questa relazione, ma un grafico a dispersione sì.

Conclusione

In sintesi:

1. In generale, un coefficiente di correlazione compreso tra 0,25 e 0,5 è considerato una correlazione “debole” tra due variabili.

2. Questa regola pratica può variare da zona a zona. Ad esempio, una correlazione molto più bassa potrebbe essere considerata debole in un campo medico rispetto a un campo tecnologico. Assicurati di utilizzare la tua esperienza in materia per decidere cosa è considerato a bassa correlazione.

3. Quando si utilizza un coefficiente di correlazione per descrivere la relazione tra due variabili, è anche utile creare un grafico a dispersione in modo da poter identificare valori anomali nel set di dati nonché una potenziale relazione non lineare.

Risorse addizionali

Cos’è considerata una correlazione “forte”?
Calcolatore della matrice di correlazione
Correlazione vs. associazione: qual è la differenza?

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *