Comment interpréter Pr(>|t|) dans la sortie du modèle de régression dans R



Chaque fois que vous effectuez une régression linéaire dans R, la sortie de votre modèle de régression sera affichée au format suivant :

Coefficients:
            Estimate Std. Error t value Pr(>|t|)  
(Intercept)  10.0035     5.9091   1.693   0.1513  
x1            1.4758     0.5029   2.935   0.0325 *
x2           -0.7834     0.8014  -0.978   0.3732 

La colonne Pr(>|t|) représente la valeur p associée à la valeur dans la colonne de valeur t .

Si la valeur p est inférieure à un certain niveau de signification (par exemple α = 0,05), alors la variable prédictive est considérée comme ayant une relation statistiquement significative avec la variable de réponse dans le modèle.

L’exemple suivant montre comment interpréter les valeurs de la colonne Pr(>|t|) pour un modèle de régression donné.

Exemple : Comment interpréter les valeurs Pr(>|t|)

Supposons que nous souhaitions ajuster un modèle de régression linéaire multiple utilisant les variables prédictives x1 et x2 et une variable de réponse unique y .

Le code suivant montre comment créer un bloc de données et ajuster un modèle de régression aux données :

#create data frame
df <- data.frame(x1=c(1, 3, 3, 4, 4, 5, 6, 6),
                 x2=c(7, 7, 5, 6, 5, 4, 5, 6),
                 y=c(8, 8, 9, 9, 13, 14, 17, 14))

#fit multiple linear regression model
model <- lm(y ~ x1 + x2, data=df)

#view model summary
summary(model)

Call:
lm(formula = y ~ x1 + x2, data = df)

Residuals:
      1       2       3       4       5       6       7       8 
 2.0046 -0.9470 -1.5138 -2.2062  1.0104 -0.2488  2.0588 -0.1578 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)  
(Intercept)  10.0035     5.9091   1.693   0.1513  
x1            1.4758     0.5029   2.935   0.0325 *
x2           -0.7834     0.8014  -0.978   0.3732  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1.867 on 5 degrees of freedom
Multiple R-squared:  0.7876,	Adjusted R-squared:  0.7026 
F-statistic: 9.268 on 2 and 5 DF,  p-value: 0.0208

Voici comment interpréter les valeurs de la colonne Pr(>|t|) :

  • La valeur p pour la variable prédictive x1 est 0,0325 . Puisque cette valeur est inférieure à 0,05, il existe une relation statistiquement significative avec la variable de réponse dans le modèle.
  • La valeur p pour la variable prédictive x2 est 0,3732 . Puisque cette valeur n’est pas inférieure à 0,05, elle n’a pas de relation statistiquement significative avec la variable de réponse dans le modèle.

Les codes de signification sous le tableau des coefficients nous indiquent qu’un seul astérisque (*) à côté de la valeur p de 0,0325 signifie que la valeur p est statistiquement significative à α = 0,05.

Comment Pr(>|t|) est-il réellement calculé ?

Voici comment la valeur de Pr(>|t|) est réellement calculée :

Étape 1 : Calculer la valeur t

Tout d’abord, nous calculons la valeur t à l’aide de la formule suivante :

  • valeur t = Estimation / Std. Erreur

Par exemple, voici comment calculer la valeur t pour la variable prédictive x1 :

#calculate t-value
1.4758 / .5029

[1] 2.934579

Étape 2 : Calculer la valeur p

Ensuite, nous calculons la valeur p. Cela représente la probabilité que la valeur absolue de la distribution t soit supérieure à 2,935.

Nous pouvons utiliser la formule suivante dans R pour calculer cette valeur :

  • valeur p = 2 * pt (abs (valeur t), df résiduel, lower.tail = FALSE)

Par exemple, voici comment calculer la valeur p pour une valeur t de 2,935 avec 5 degrés de liberté résiduels :

#calculate p-value
2 * pt(abs(2.935), 5, lower.tail = FALSE)

[1] 0.0324441

Notez que cette valeur p correspond à la valeur p dans la sortie de régression ci-dessus.

Remarque : La valeur des degrés de liberté résiduels se trouve en bas de la sortie de régression. Dans notre exemple, il s’est avéré être 5 :

Residual standard error: 1.867 on 5 degrees of freedom

Ressources additionnelles

Comment effectuer une régression linéaire simple dans R
Comment effectuer une régression linéaire multiple dans R
Comment tracer plusieurs résultats de régression linéaire dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *