Personnaliser les préférences

Nous utilisons des cookies pour vous aider à naviguer efficacement et à exécuter certaines fonctions. Vous trouverez ci-dessous des informations détaillées sur tous les cookies sous chaque catégorie de consentement.

Les cookies classés comme « Nécessaires » sont stockés sur votre navigateur car ils sont essentiels pour activer les fonctionnalités de base du site.... 

Toujours actif

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

Aucun cookie à afficher.

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

Aucun cookie à afficher.

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

Aucun cookie à afficher.

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

Aucun cookie à afficher.

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

Aucun cookie à afficher.

Comment utiliser la fonction coeftest() dans R



Vous pouvez utiliser la fonction coeftest() du package lmtest dans R pour effectuer un test t pour chaque coefficient estimé dans un modèle de régression.

Cette fonction utilise la syntaxe de base suivante :

coeftest(x)

où:

  • x : Nom du modèle de régression ajusté

L’exemple suivant montre comment utiliser cette fonction dans la pratique.

Exemple : comment utiliser la fonction coeftest() dans R

Supposons que nous ayons le bloc de données suivant dans R qui montre le nombre d’heures passées à étudier, le nombre d’examens pratiques passés et la note à l’examen final de 10 étudiants dans une classe :

#create data frame
df <- data.frame(score=c(77, 79, 84, 85, 88, 99, 95, 90, 92, 94),
                 hours=c(1, 1, 2, 3, 2, 4, 4, 2, 3, 3),
                 prac_exams=c(2, 3, 3, 2, 4, 5, 4, 3, 5, 4))

#view data frame
df

   score hours prac_exams
1     77     1          2
2     79     1          3
3     84     2          3
4     85     3          2
5     88     2          4
6     99     4          5
7     95     4          4
8     90     2          3
9     92     3          5
10    94     3          4

Supposons maintenant que nous souhaitions adapter le modèle de régression linéaire multiple suivant dans R :

Score d’examen = β 0 + β 1 (heures) + β 2 (examens pratiques)

Nous pouvons utiliser la fonction lm() pour adapter ce modèle :

#fit multiple linear regression model
fit <- lm(score ~ hours + prac_exams, data=df)

Nous pouvons ensuite utiliser la fonction coeftest() pour effectuer un test t pour chaque coefficient de régression ajusté dans le modèle :

library(lmtest)

#perform t-test for each coefficient in model
coeftest(fit)

t test of coefficients:

            Estimate Std. Error t value  Pr(>|t|)    
(Intercept) 68.40294    2.87227 23.8150 5.851e-08 ***
hours        4.19118    0.99612  4.2075  0.003998 ** 
prac_exams   2.69118    0.99612  2.7017  0.030566 *  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

La statistique du test t et la valeur p correspondante sont affichées pour chaque test t :

  • Interception : t = 23,8150, p = <0,000
  • heures : t = 4,2075, p = 0,003998
  • prac_exams : t = 2,7017, p = 0,030566

Notez que nous utilisons les hypothèses nulles et alternatives suivantes pour chaque test t :

  • H 0 : β i = 0 (la pente est égale à zéro)
  • H A : β i ≠ 0 (la pente n’est pas égale à zéro)

Si la valeur p du test t est inférieure à un certain seuil (par exemple α = 0,05), alors nous rejetons l’hypothèse nulle et concluons qu’il existe une relation statistiquement significative entre la variable prédictive et la variable réponse.

Étant donné que la valeur p pour chaque test t est inférieure à 0,05, nous conclurions que chaque variable prédictive du modèle a une relation statistiquement significative avec la variable de réponse.

Dans le contexte de cet exemple, nous dirions que les heures passées à étudier et le nombre d’examens pratiques passés sont tous deux des prédicteurs statistiquement significatifs de la note finale des étudiants à l’examen.

Ressources additionnelles

Les didacticiels suivants fournissent des informations supplémentaires sur la régression linéaire dans R :

Comment interpréter la sortie de régression dans R
Comment effectuer une régression linéaire simple dans R
Comment effectuer une régression linéaire multiple dans R
Comment effectuer une régression logistique dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *