Comment interpréter les codes de signification dans R



Lorsque vous effectuez une analyse de régression ou une ANOVA dans R, les tableaux de sortie contiennent des valeurs p pour les variables utilisées dans l’analyse ainsi que les codes de signification correspondants.

Ces codes de signification sont affichés sous la forme d’une série d’étoiles ou d’un point décimal si les variables sont statistiquement significatives.

Voici comment interpréter les différents codes de signification :

significance code         p-value
   ***                 [0, 0.001]
    **              (0.001, 0.01]
     *               (0.01, 0.05]
     .                (0.05, 0.1]
                         (0.1, 1] 

Les exemples suivants montrent comment interpréter ces codes de signification dans la pratique.

Exemple : codes de signification en régression

Le code suivant montre comment ajuster un modèle de régression linéaire multiple avec l’ensemble de données mtcars intégré en utilisant hp , drat et wt comme variables prédictives et mpg comme variable de réponse :

#fit regression model using hp, drat, and wt as predictors
model <- lm(mpg ~ hp + drat + wt, data = mtcars)

#view model summary
summary(model)

Call:
lm(formula = mpg ~ hp + drat + wt, data = mtcars)

Residuals:
    Min      1Q  Median      3Q     Max 
-3.3598 -1.8374 -0.5099  0.9681  5.7078 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 29.394934   6.156303   4.775 5.13e-05 ***
hp          -0.032230   0.008925  -3.611 0.001178 ** 
drat         1.615049   1.226983   1.316 0.198755    
wt          -3.227954   0.796398  -4.053 0.000364 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 2.561 on 28 degrees of freedom
Multiple R-squared:  0.8369,	Adjusted R-squared:  0.8194 
F-statistic: 47.88 on 3 and 28 DF,  p-value: 3.768e-11

Voici comment interpréter les codes de signification pour les trois variables prédictives :

  • hp a une valeur p de 0,001178 . Puisque cette valeur est comprise dans la plage (0,001, 0,01] , elle a un code de signification de **
  • drat a une valeur p de 0,198755 . Étant donné que cette valeur est comprise dans la plage (0,1, 1] , elle n’a aucun code de signification.
  • wt a une valeur p de .000364 . Puisque cette valeur est comprise dans la plage [0, 0,001] , elle a un code de signification de ***

Si nous utilisions un niveau alpha de α = 0,05 pour déterminer quels prédicteurs étaient significatifs dans ce modèle de régression, nous dirions que hp et wt sont des prédicteurs statistiquement significatifs alors que drat ne l’est pas.

Exemple : codes de signification dans l’ANOVA

Le code suivant montre comment ajuster un modèle ANOVA unidirectionnel avec l’ensemble de données mtcars intégré en utilisant gear comme variable factorielle et mpg comme variable de réponse :

#fit one-way ANOVA
model <- aov(mpg ~ gear, data = mtcars)

#view the model output
summary(model)

            Df Sum Sq Mean Sq F value Pr(>F)   
gear         1  259.7  259.75   8.995 0.0054 **
Residuals   30  866.3   28.88                  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Voici comment interpréter le code de signification dans la sortie :

  • l’engrenage a une valeur p de 0,0054 . Puisque cette valeur est comprise dans la plage (0,001, 0,01] , elle a un code de signification de **

En utilisant un niveau alpha de α = 0,05, nous dirions que l’engrenage est statistiquement significatif. En d’autres termes, il existe une différence statistiquement significative entre le mpg moyen des voitures en fonction de leur valeur d’ équipement .

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *