R multiplo o r quadrato: qual è la differenza?
Quando si adatta un modello di regressione utilizzando la maggior parte dei software statistici, spesso si noteranno i due valori seguenti nel risultato:
R multiplo: il coefficiente di correlazione multipla tra tre o più variabili.
R-quadrato: viene calcolato come (Multiplo R) 2 e rappresenta la proporzione della varianza nella variabile di risposta di un modello di regressione che può essere spiegata dalle variabili predittive. Questo valore varia da 0 a 1.
In pratica, siamo spesso interessati al valore R quadrato perché ci dice quanto siano utili le variabili predittive nel prevedere il valore della variabile di risposta.
Tuttavia, ogni volta che aggiungiamo una nuova variabile predittiva al modello, è garantito che l’R quadrato aumenterà anche se la variabile predittiva non è utile.
R-quadrato rettificato è una versione modificata di R-quadrato che regola il numero di predittori in un modello di regressione. Viene calcolato come segue:
R 2 corretto = 1 – [(1-R 2 )*(n-1)/(nk-1)]
Oro:
- R 2 : La R 2 del modello
- n : il numero di osservazioni
- k : il numero di variabili predittive
Poiché R al quadrato aumenta sempre man mano che si aggiungono più predittori a un modello, l’R al quadrato rettificato può fungere da metrica che indica l’utilità di un modello, regolato in base al numero di predittori in un modello .
Per comprendere meglio ciascuno di questi termini, considerare il seguente esempio.
Esempio: R multipli, R quadrati e R quadrati rettificati
Supponiamo di avere il seguente set di dati che contiene le seguenti tre variabili per 12 studenti diversi:
Supponiamo di adattare un modello di regressione lineare multipla utilizzando le ore di studio e il voto attuale come variabili predittive e il punteggio dell’esame come variabile di risposta e di ottenere il seguente risultato:
Possiamo osservare i valori delle seguenti tre metriche:
R multiplo: 0,978 . Ciò rappresenta la correlazione multipla tra la variabile di risposta e le due variabili predittive.
R quadrato: 0,956 . Questo viene calcolato come (Multiplo R) 2 = (0,978) 2 = 0,956. Questo ci dice che il 95,6% della variazione dei punteggi degli esami può essere spiegato dal numero di ore trascorse a studiare dagli studenti e dal voto attuale nel corso.
R quadrato corretto: 0,946 . Questo viene calcolato come segue:
R 2 corretto = 1 – [(1-R 2 )*(n-1)/(nk-1)] = 1 – [(1-.956)*(12-1)/(12-2-1) ] = 0,946.
Questo rappresenta il valore R quadrato, aggiustato per il numero di variabili predittive nel modello .
Questa misura sarebbe utile se, ad esempio, adattassimo un altro modello di regressione con 10 predittori e scoprissimo che l’R quadrato corretto di quel modello era 0,88 . Ciò indicherebbe che il modello di regressione con solo due predittori è migliore perché ha un valore R quadrato corretto più elevato.
Risorse addizionali
Introduzione alla regressione lineare multipla
Qual è un buon valore di R quadrato?