Comment extraire les valeurs P de la fonction lm() dans R



Vous pouvez utiliser les méthodes suivantes pour extraire les valeurs p de la fonction lm() dans R :

Méthode 1 : Extraire la valeur P globale du modèle de régression

#define function to extract overall p-value of model
overall_p <- function(my_model) {
    f <- summary(my_model)$fstatistic
    p <- pf(f[1],f[2],f[3],lower.tail=F)
    attributes(p) <- NULL
    return(p)
}

#extract overall p-value of model
overall_p(model)

Méthode 2 : Extraire les valeurs P individuelles pour les coefficients de régression

summary(model)$coefficients[,4]

L’exemple suivant montre comment utiliser ces méthodes dans la pratique.

Exemple : extraire les valeurs P de lm() dans R

Supposons que nous ajustions le modèle de régression linéaire multiple suivant dans R :

#create data frame
df <- data.frame(rating=c(67, 75, 79, 85, 90, 96, 97),
                 points=c(8, 12, 16, 15, 22, 28, 24),
                 assists=c(4, 6, 6, 5, 3, 8, 7),
                 rebounds=c(1, 4, 3, 3, 2, 6, 7))

#fit multiple linear regression model
model <- lm(rating ~ points + assists + rebounds, data=df)

Nous pouvons utiliser la fonction summary() pour afficher le résumé complet du modèle de régression :

#view model summary
summary(model)

Call:
lm(formula = rating ~ points + assists + rebounds, data = df)

Residuals:
      1       2       3       4       5       6       7 
-1.5902 -1.7181  0.2413  4.8597 -1.0201 -0.6082 -0.1644 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)   
(Intercept)  66.4355     6.6932   9.926  0.00218 **
points        1.2152     0.2788   4.359  0.02232 * 
assists      -2.5968     1.6263  -1.597  0.20860   
rebounds      2.8202     1.6118   1.750  0.17847   
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.193 on 3 degrees of freedom
Multiple R-squared:  0.9589,	Adjusted R-squared:  0.9179 
F-statistic: 23.35 on 3 and 3 DF,  p-value: 0.01396

Tout en bas du résultat, nous pouvons voir que la valeur p globale du modèle de régression est 0,01396 .

Si nous souhaitons extraire uniquement cette valeur p du modèle, nous pouvons définir une fonction personnalisée pour le faire :

#define function to extract overall p-value of model
overall_p <- function(my_model) {
    f <- summary(my_model)$fstatistic
    p <- pf(f[1],f[2],f[3],lower.tail=F)
    attributes(p) <- NULL
    return(p)
}

#extract overall p-value of model
overall_p(model)

[1] 0.01395572

Notez que la fonction renvoie la même valeur p que la sortie du modèle ci-dessus.

Pour extraire les valeurs p pour les coefficients de régression individuels du modèle, nous pouvons utiliser la syntaxe suivante :

#extract p-values for individual regression coefficients in model
summary(model)$coefficients[,4] 

(Intercept)      points     assists    rebounds 
0.002175313 0.022315418 0.208600183 0.178471275  

Notez que les valeurs p affichées ici correspondent à celles de la colonne Pr(> |t|) dans la sortie de régression ci-dessus.

Connexe : Comment extraire le R-Squared de la fonction lm() dans R

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans R :

Comment effectuer une régression linéaire simple dans R
Comment effectuer une régression linéaire multiple dans R
Comment créer un tracé résiduel dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *