Come calcolare la correlazione in sas (con esempi)


Un modo per quantificare la relazione tra due variabili è utilizzare il coefficiente di correlazione di Pearson , che misura l’associazione lineare tra due variabili .

Assume sempre un valore compreso tra -1 e 1 dove:

  • -1 indica una correlazione lineare perfettamente negativa tra due variabili
  • 0 indica alcuna correlazione lineare tra due variabili
  • 1 indica una correlazione lineare perfettamente positiva tra due variabili

Quanto più il coefficiente di correlazione si allontana da zero, tanto più forte è la relazione tra le due variabili.

Gli esempi seguenti mostrano come utilizzare proc corr in SAS per calcolare il coefficiente di correlazione tra le variabili nel set di dati integrato SAS chiamato Fish , che contiene varie misurazioni per 159 pesci diversi catturati in un lago in Finlandia.

Possiamo usare proc print per visualizzare le prime 10 osservazioni di questo set di dati:

 /*view first 10 observations from Fish dataset*/
proc print data =sashelp.Fish( obs = 10 );

run ;

Esempio 1: correlazione tra due variabili

Possiamo utilizzare il seguente codice per calcolare il coefficiente di correlazione di Pearson tra le variabili Altezza e Larghezza:

 /*calculate correlation coefficient between Height and Width*/
proc corr data =sashelp.fish;
	var HeightWidth;

run ;

La prima tabella visualizza le statistiche riepilogative per altezza e larghezza.

La seconda tabella mostra il coefficiente di correlazione di Pearson tra le due variabili, incluso un valore p che ci dice se la correlazione è statisticamente significativa.

Dal risultato possiamo vedere:

  • Coefficiente di correlazione di Pearson: 0,79288
  • Valore P: <0,0001

Questo ci dice che esiste una forte correlazione positiva tra altezza e larghezza e che la correlazione è statisticamente significativa poiché il valore p è inferiore a α = 0,05.

Correlati: cos’è considerata una correlazione “forte”?

Esempio 2: correlazione tra tutte le variabili

Possiamo utilizzare il seguente codice per calcolare il coefficiente di correlazione di Pearson tra tutte le combinazioni di variabili a coppie nel set di dati:

 /*calculate correlation coefficient between all pairwise combinations of variables*/
proc corr data =sashelp.fish;

run;

matrice di correlazione in SAS

Il risultato mostra una matrice di correlazione , che contiene il coefficiente di correlazione di Pearson e i corrispondenti valori p per ciascuna combinazione a coppie di variabili numeriche nel set di dati.

Per esempio:

  • Il coefficiente di correlazione di Pearson tra peso e lunghezza1 è 0,91644.
  • Il coefficiente di correlazione di Pearson tra peso e lunghezza2 è 0,91937.
  • Il coefficiente di correlazione di Pearson tra peso e lunghezza3 è 0,92447.

E così via.

Esempio 3: Visualizza la correlazione con un grafico a dispersione

Possiamo anche utilizzare la funzione plots per creare un grafico a dispersione per visualizzare la correlazione tra due variabili:

 /*visualize correlation between Height and Width*/
proc corr data =sashelp.fish plots =scatter( nvar =all);;
	var HeightWidth;

run; 

Nel grafico possiamo vedere la forte correlazione positiva tra altezza e larghezza. All’aumentare dell’altezza, anche la larghezza tende ad aumentare.

Nell’angolo in alto a sinistra del grafico possiamo anche vedere il totale delle osservazioni utilizzate, il coefficiente di correlazione e il valore p del coefficiente di correlazione.

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre operazioni comuni in SAS:

Come creare tabelle di frequenza in SAS
Come calcolare le statistiche descrittive in SAS

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *