Comment réparer dans R : type (liste) non valide pour la variable



Une erreur que vous pouvez rencontrer dans R est :

Error in model.frame.default(formula = y ~ x, drop.unused.levels = TRUE) : 
  invalid type (list) for variable 'x' 

Cette erreur se produit généralement lorsque vous tentez d’ajuster un modèle de régression ou un modèle ANOVA dans R et d’utiliser une liste pour l’une des variables au lieu d’un vecteur .

Ce didacticiel explique comment corriger cette erreur dans la pratique.

Comment reproduire l’erreur

Supposons que j’essaie d’adapter un modèle de régression linéaire simple dans R :

#define variables
x <- list(1, 4, 4, 5, 7, 8, 9, 10, 13, 14)
y <- c(10, 13, 13, 14, 18, 20, 22, 24, 29, 31)

#attempt to fit regression model
model <- lm(y ~ x)

Error in model.frame.default(formula = y ~ x, drop.unused.levels = TRUE) : 
  invalid type (list) for variable 'x'

Je reçois une erreur car la fonction lm() ne peut prendre que des vecteurs en entrée et la variable x est actuellement une liste.

Comment éviter l’erreur

Le moyen le plus simple d’éviter cette erreur est d’utiliser simplement la fonction unlist() pour convertir la variable de liste en vecteur :

#define variables
x <- list(1, 4, 4, 5, 7, 8, 9, 10, 13, 14)
y <- c(10, 13, 13, 14, 18, 20, 22, 24, 29, 31)

#attempt to fit regression model
model <- lm(y ~ unlist(x))

#view the model output
summary(model)

Call:
lm(formula = y ~ unlist(x))

Residuals:
    Min      1Q  Median      3Q     Max 
-1.1282 -0.4194 -0.1087  0.2966  1.7068 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)  6.58447    0.55413   11.88 2.31e-06 ***
unlist(x)    1.70874    0.06544   26.11 4.97e-09 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 0.8134 on 8 degrees of freedom
Multiple R-squared:  0.9884,	Adjusted R-squared:  0.987 
F-statistic: 681.8 on 1 and 8 DF,  p-value: 4.97e-09

Notez que nous sommes capables d’adapter le modèle de régression linéaire simple sans aucune erreur cette fois-ci car nous avons utilisé unlist() pour convertir la variable x en vecteur.

Notez que si vous ajustez un modèle de régression linéaire multiple et que vous disposez de plusieurs variables prédictives qui sont actuellement des objets de liste, vous pouvez utiliser unlist() pour convertir chacune d’elles en vecteurs avant d’ajuster le modèle de régression :

#define variables
x1 <- list(1, 4, 4, 5, 7, 8, 9, 10, 13, 14)
x2 <- list(20, 16, 16, 15, 16, 12, 10, 8, 8, 4)
y <- c(10, 13, 13, 14, 18, 20, 22, 24, 29, 31)

#fit multiple linear regression model
model <- lm(y ~ unlist(x1) + unlist(x2))

#view the model output
summary(model)

Call:
lm(formula = y ~ unlist(x1) + unlist(x2))

Residuals:
    Min      1Q  Median      3Q     Max 
-1.1579 -0.4211 -0.1386  0.3108  1.7130 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)  8.34282    4.44971   1.875 0.102932    
unlist(x1)   1.61339    0.24899   6.480 0.000341 ***
unlist(x2)  -0.08346    0.20937  -0.399 0.702044    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 0.8599 on 7 degrees of freedom
Multiple R-squared:  0.9887,	Adjusted R-squared:  0.9854 
F-statistic: 305.1 on 2 and 7 DF,  p-value: 1.553e-07

Encore une fois, nous ne recevons aucune erreur puisque nous avons converti chacun des objets de la liste en vecteurs.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes dans R :

Comment interpréter la sortie glm dans R
Comment interpréter les résultats de l’ANOVA dans R
Comment gérer R Avertissement : glm.fit : l’algorithme n’a pas convergé

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *