R multiplo o r quadrato: qual è la differenza?


Quando si adatta un modello di regressione utilizzando la maggior parte dei software statistici, spesso si noteranno i due valori seguenti nel risultato:

R multiplo: il coefficiente di correlazione multipla tra tre o più variabili.

R-quadrato: viene calcolato come (Multiplo R) 2 e rappresenta la proporzione della varianza nella variabile di risposta di un modello di regressione che può essere spiegata dalle variabili predittive. Questo valore varia da 0 a 1.

In pratica, siamo spesso interessati al valore R quadrato perché ci dice quanto siano utili le variabili predittive nel prevedere il valore della variabile di risposta.

Tuttavia, ogni volta che aggiungiamo una nuova variabile predittiva al modello, è garantito che l’R quadrato aumenterà anche se la variabile predittiva non è utile.

R-quadrato rettificato è una versione modificata di R-quadrato che regola il numero di predittori in un modello di regressione. Viene calcolato come segue:

R 2 corretto = 1 – [(1-R 2 )*(n-1)/(nk-1)]

Oro:

  • R 2 : La R 2 del modello
  • n : il numero di osservazioni
  • k : il numero di variabili predittive

Poiché R al quadrato aumenta sempre man mano che si aggiungono più predittori a un modello, l’R al quadrato rettificato può fungere da metrica che indica l’utilità di un modello, regolato in base al numero di predittori in un modello .

Per comprendere meglio ciascuno di questi termini, considerare il seguente esempio.

Esempio: R multipli, R quadrati e R quadrati rettificati

Supponiamo di avere il seguente set di dati che contiene le seguenti tre variabili per 12 studenti diversi:

Supponiamo di adattare un modello di regressione lineare multipla utilizzando le ore di studio e il voto attuale come variabili predittive e il punteggio dell’esame come variabile di risposta e di ottenere il seguente risultato:

R multipla contro R quadrata

Possiamo osservare i valori delle seguenti tre metriche:

R multiplo: 0,978 . Ciò rappresenta la correlazione multipla tra la variabile di risposta e le due variabili predittive.

R quadrato: 0,956 . Questo viene calcolato come (Multiplo R) 2 = (0,978) 2 = 0,956. Questo ci dice che il 95,6% della variazione dei punteggi degli esami può essere spiegato dal numero di ore trascorse a studiare dagli studenti e dal voto attuale nel corso.

R quadrato corretto: 0,946 . Questo viene calcolato come segue:

R 2 corretto = 1 – [(1-R 2 )*(n-1)/(nk-1)] = 1 – [(1-.956)*(12-1)/(12-2-1) ] = 0,946.

Questo rappresenta il valore R quadrato, aggiustato per il numero di variabili predittive nel modello .

Questa misura sarebbe utile se, ad esempio, adattassimo un altro modello di regressione con 10 predittori e scoprissimo che l’R quadrato corretto di quel modello era 0,88 . Ciò indicherebbe che il modello di regressione con solo due predittori è migliore perché ha un valore R quadrato corretto più elevato.

Risorse addizionali

Introduzione alla regressione lineare multipla
Qual è un buon valore di R quadrato?

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *