Personnaliser les préférences

Nous utilisons des cookies pour vous aider à naviguer efficacement et à exécuter certaines fonctions. Vous trouverez ci-dessous des informations détaillées sur tous les cookies sous chaque catégorie de consentement.

Les cookies classés comme « Nécessaires » sont stockés sur votre navigateur car ils sont essentiels pour activer les fonctionnalités de base du site.... 

Toujours actif

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

Aucun cookie à afficher.

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

Aucun cookie à afficher.

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

Aucun cookie à afficher.

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

Aucun cookie à afficher.

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

Aucun cookie à afficher.

Comment interpréter Pr(>|t|) dans la sortie du modèle de régression dans R



Chaque fois que vous effectuez une régression linéaire dans R, la sortie de votre modèle de régression sera affichée au format suivant :

Coefficients:
            Estimate Std. Error t value Pr(>|t|)  
(Intercept)  10.0035     5.9091   1.693   0.1513  
x1            1.4758     0.5029   2.935   0.0325 *
x2           -0.7834     0.8014  -0.978   0.3732 

La colonne Pr(>|t|) représente la valeur p associée à la valeur dans la colonne de valeur t .

Si la valeur p est inférieure à un certain niveau de signification (par exemple α = 0,05), alors la variable prédictive est considérée comme ayant une relation statistiquement significative avec la variable de réponse dans le modèle.

L’exemple suivant montre comment interpréter les valeurs de la colonne Pr(>|t|) pour un modèle de régression donné.

Exemple : Comment interpréter les valeurs Pr(>|t|)

Supposons que nous souhaitions ajuster un modèle de régression linéaire multiple utilisant les variables prédictives x1 et x2 et une variable de réponse unique y .

Le code suivant montre comment créer un bloc de données et ajuster un modèle de régression aux données :

#create data frame
df <- data.frame(x1=c(1, 3, 3, 4, 4, 5, 6, 6),
                 x2=c(7, 7, 5, 6, 5, 4, 5, 6),
                 y=c(8, 8, 9, 9, 13, 14, 17, 14))

#fit multiple linear regression model
model <- lm(y ~ x1 + x2, data=df)

#view model summary
summary(model)

Call:
lm(formula = y ~ x1 + x2, data = df)

Residuals:
      1       2       3       4       5       6       7       8 
 2.0046 -0.9470 -1.5138 -2.2062  1.0104 -0.2488  2.0588 -0.1578 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)  
(Intercept)  10.0035     5.9091   1.693   0.1513  
x1            1.4758     0.5029   2.935   0.0325 *
x2           -0.7834     0.8014  -0.978   0.3732  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1.867 on 5 degrees of freedom
Multiple R-squared:  0.7876,	Adjusted R-squared:  0.7026 
F-statistic: 9.268 on 2 and 5 DF,  p-value: 0.0208

Voici comment interpréter les valeurs de la colonne Pr(>|t|) :

  • La valeur p pour la variable prédictive x1 est 0,0325 . Puisque cette valeur est inférieure à 0,05, il existe une relation statistiquement significative avec la variable de réponse dans le modèle.
  • La valeur p pour la variable prédictive x2 est 0,3732 . Puisque cette valeur n’est pas inférieure à 0,05, elle n’a pas de relation statistiquement significative avec la variable de réponse dans le modèle.

Les codes de signification sous le tableau des coefficients nous indiquent qu’un seul astérisque (*) à côté de la valeur p de 0,0325 signifie que la valeur p est statistiquement significative à α = 0,05.

Comment Pr(>|t|) est-il réellement calculé ?

Voici comment la valeur de Pr(>|t|) est réellement calculée :

Étape 1 : Calculer la valeur t

Tout d’abord, nous calculons la valeur t à l’aide de la formule suivante :

  • valeur t = Estimation / Std. Erreur

Par exemple, voici comment calculer la valeur t pour la variable prédictive x1 :

#calculate t-value
1.4758 / .5029

[1] 2.934579

Étape 2 : Calculer la valeur p

Ensuite, nous calculons la valeur p. Cela représente la probabilité que la valeur absolue de la distribution t soit supérieure à 2,935.

Nous pouvons utiliser la formule suivante dans R pour calculer cette valeur :

  • valeur p = 2 * pt (abs (valeur t), df résiduel, lower.tail = FALSE)

Par exemple, voici comment calculer la valeur p pour une valeur t de 2,935 avec 5 degrés de liberté résiduels :

#calculate p-value
2 * pt(abs(2.935), 5, lower.tail = FALSE)

[1] 0.0324441

Notez que cette valeur p correspond à la valeur p dans la sortie de régression ci-dessus.

Remarque : La valeur des degrés de liberté résiduels se trouve en bas de la sortie de régression. Dans notre exemple, il s’est avéré être 5 :

Residual standard error: 1.867 on 5 degrees of freedom

Ressources additionnelles

Comment effectuer une régression linéaire simple dans R
Comment effectuer une régression linéaire multiple dans R
Comment tracer plusieurs résultats de régression linéaire dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *