Una rapida introduzione all'analisi bivariata
Il termine analisi bivariata si riferisce all’analisi di due variabili. Puoi ricordarlo perché il prefisso “bi” significa “due”.
L’obiettivo dell’analisi bivariata è comprendere la relazione tra due variabili. È possibile confrontare questo tipo di analisi con quanto segue:
- Analisi univariata : analisi di una variabile.
- Analisi multivariata: analisi di due o più variabili.
Esistono tre modi comuni per eseguire l’analisi bivariata:
1. Grafici a dispersione.
2. Coefficienti di correlazione.
3. Regressione lineare semplice.
Questo tutorial fornisce un esempio di ciascuno di questi tipi di analisi bivariata utilizzando il seguente set di dati che contiene informazioni su due variabili: (1) Ore trascorse a studiare e (2) Punteggi degli esami ottenuti da 20 studenti diversi:
1. Nuvole di punti
Un grafico a dispersione fornisce un modo visivo per eseguire analisi bivariate. Ci consente di visualizzare la relazione tra due variabili posizionando il valore di una variabile sull’asse x e il valore dell’altra variabile sull’asse y.
Nel grafico a dispersione sottostante posizioniamo le ore studiate sull’asse x e i risultati degli esami sull’asse y:
Si vede chiaramente che esiste una relazione positiva tra le due variabili: all’aumentare del numero di ore di studio, anche i punteggi degli esami tendono ad aumentare.
2. Coefficienti di correlazione
Un coefficiente di correlazione fornisce un altro modo per eseguire l’analisi bivariata. Il tipo più comune di coefficiente di correlazione è il coefficiente di correlazione di Pearson , che è una misura dell’associazione lineare tra due variabili. Ha un valore compreso tra -1 e 1 dove:
- -1 indica una correlazione lineare perfettamente negativa tra due variabili
- 0 indica alcuna correlazione lineare tra due variabili
- 1 indica una correlazione lineare perfettamente positiva tra due variabili
Questa semplice metrica ci dà una buona idea di come sono correlate due variabili. In pratica, utilizziamo spesso grafici a dispersione e coefficienti di correlazione per comprendere la relazione tra due variabili in modo da poter visualizzare e quantificare la loro relazione.
3. Regressione lineare semplice
Un terzo modo per eseguire l’analisi bivariata consiste nell’utilizzare la regressione lineare semplice .
Utilizzando questo metodo, scegliamo una variabile come variabile esplicativa e l’altra variabile come variabile di risposta . Troviamo quindi la riga che meglio “si adatta” al set di dati, che possiamo quindi utilizzare per comprendere l’esatta relazione tra le due variabili.
Ad esempio, la riga più adatta per il set di dati sopra è:
Punteggio esame = 69,07 + 3,85*(ore studiate)
Ciò significa che ogni ora aggiuntiva studiata è associata a un aumento del punteggio medio dell’esame di 3,85. Adattando questo modello di regressione lineare, possiamo quantificare l’esatta relazione tra le ore studiate e il voto dell’esame.
Correlato: Come eseguire una regressione lineare semplice in Excel
Conclusione
L’analisi bivariata è uno dei tipi di analisi più comunemente utilizzati in statistica perché spesso vogliamo comprendere la relazione tra due variabili.
Utilizzando grafici a dispersione, coefficienti di correlazione e una semplice regressione lineare, possiamo visualizzare e quantificare la relazione tra due variabili.
Spesso questi tre metodi vengono utilizzati insieme in un’analisi per ottenere un quadro completo della relazione tra due variabili. Quindi è una buona idea familiarizzare con ciascun metodo.