Come trovare il coefficiente di determinazione (r quadrato) in r
Il coefficiente di determinazione (comunemente indicato con R 2 ) è la proporzione della varianza della variabile di risposta che può essere spiegata dalle variabili esplicative in un modello di regressione.
Questo tutorial fornisce un esempio di come trovare e interpretare R2 in un modello di regressione in R.
Correlato: Qual è un buon valore R quadrato?
Esempio: trovare e interpretare R-quadrato in R
Supponiamo di avere il seguente set di dati contenente dati sul numero di ore studiate, esami preparatori sostenuti e punteggi degli esami ricevuti per 15 studenti:
#create data frame df <- data.frame(hours=c(1, 2, 2, 4, 2, 1, 5, 4, 2, 4, 4, 3, 6, 5, 3), prep_exams=c(1, 3, 3, 5, 2, 2, 1, 1, 0, 3, 4, 3, 2, 4, 4), score=c(76, 78, 85, 88, 72, 69, 94, 94, 88, 92, 90, 75, 96, 90, 82)) #view first six rows of data frame head(df) hours prep_exams score 1 1 1 76 2 2 3 78 3 2 3 85 4 4 5 88 5 2 2 72 6 1 2 69
Il codice seguente mostra come adattare un modello di regressione lineare multipla a questo set di dati e visualizzare l’output del modello in R:
#fit regression model model <- lm(score~hours+prep_exams, data=df) #view model summary summary(model) Call: lm(formula = score ~ hours + prep_exams, data = df) Residuals: Min 1Q Median 3Q Max -7.9896 -2.5514 0.3079 3.3370 7.0352 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 71.8078 3.5222 20.387 1.12e-10 *** hours 5.0247 0.8964 5.606 0.000115 *** prep_exams -1.2975 0.9689 -1.339 0.205339 --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 4.944 on 12 degrees of freedom Multiple R-squared: 0.7237, Adjusted R-squared: 0.6776 F-statistic: 15.71 on 2 and 12 DF, p-value: 0.0004454
L’R quadrato del modello (mostrato nella parte inferiore dell’output) risulta essere 0,7237 .
Ciò significa che il 72,37% della variazione dei punteggi degli esami può essere spiegato dal numero di ore studiate e dal numero di esami pratici sostenuti.
Tieni presente che puoi accedere a questo valore anche utilizzando la seguente sintassi:
summary(model)$r.squared [1] 0.7236545
Come interpretare il valore R-quadrato
Un valore R al quadrato sarà sempre compreso tra 0 e 1.
Un valore pari a 1 indica che le variabili esplicative possono spiegare perfettamente la varianza della variabile di risposta e un valore pari a 0 indica che le variabili esplicative non hanno la capacità di spiegare la varianza della variabile di risposta.
In generale, maggiore è il valore R quadrato di un modello di regressione, migliore è la capacità delle variabili esplicative di predire il valore della variabile di risposta.
Consulta questo articolo per maggiori dettagli su come determinare se un dato valore R quadrato è considerato “buono” o meno per un dato modello di regressione.
Correlato: Come calcolare l’R quadrato corretto in R