Come calcolare la correlazione parziale in excel
Nelle statistiche, spesso utilizziamo il coefficiente di correlazione di Pearson per misurare la relazione lineare tra due variabili. Tuttavia, a volte vogliamo comprendere la relazione tra due variabili controllandone una terza .
Ad esempio, supponiamo di voler misurare l’associazione tra il numero di ore di studio di uno studente e il voto dell’esame finale, controllando il voto attuale dello studente nella classe. In questo caso, potremmo utilizzare la correlazione parziale per misurare il rapporto tra le ore studiate e il voto dell’esame finale.
Questo tutorial spiega come calcolare una correlazione parziale in Excel.
Esempio: correlazione parziale in Excel
Supponiamo di avere un set di dati che visualizza le seguenti informazioni per 10 studenti:
- Voto attuale in una classe
- Ore dedicate allo studio per l’esame finale
- Punteggio dell’esame finale
Utilizzare i seguenti passaggi per trovare la correlazione parziale tra le ore studiate e il voto dell’esame controllando il voto corrente.
Passaggio 1: calcolare ciascuna correlazione a coppie.
Innanzitutto, calcoleremo la correlazione tra ciascuna combinazione di variabili a coppie:
Passaggio 2: calcolare la correlazione parziale tra ore e punteggio dell’esame.
La formula per calcolare la correlazione parziale tra la variabile A e la variabile B controllando la variabile C è la seguente:
Correlazione parziale = (r A,B – r A,C *r B,C ) / √((1-r 2 A,B )(1-r 2 B,C ))
La schermata seguente mostra come utilizzare questa formula per calcolare la correlazione parziale tra le ore e il voto dell’esame, controllando il voto corrente:
La correlazione parziale è 0,190626 . Per determinare se questa correlazione è statisticamente significativa, possiamo trovare il valore p corrispondente.
Passaggio 3: calcolare il valore p della correlazione parziale.
La statistica t- test può essere calcolata come segue:
t = r√(n-3) / √(1-r 2 )
La schermata seguente mostra come utilizzare questa formula per calcolare la statistica del test e il valore p corrispondente:
La statistica del test t è 0,51377 . Il numero totale di gradi di libertà è n-3 = 10-3 = 7 . Il valore p corrispondente è 0,623228 . Poiché questo valore non è inferiore a 0,05, significa che la correlazione parziale tra ore e risultati degli esami non è statisticamente significativa.