Comment réparer dans R : type (liste) non valide pour la variable
Une erreur que vous pouvez rencontrer dans R est :
Error in model.frame.default(formula = y ~ x, drop.unused.levels = TRUE) : invalid type (list) for variable 'x'
Cette erreur se produit généralement lorsque vous tentez d’ajuster un modèle de régression ou un modèle ANOVA dans R et d’utiliser une liste pour l’une des variables au lieu d’un vecteur .
Ce didacticiel explique comment corriger cette erreur dans la pratique.
Comment reproduire l’erreur
Supposons que j’essaie d’adapter un modèle de régression linéaire simple dans R :
#define variables
x <- list(1, 4, 4, 5, 7, 8, 9, 10, 13, 14)
y <- c(10, 13, 13, 14, 18, 20, 22, 24, 29, 31)
#attempt to fit regression model
model <- lm(y ~ x)
Error in model.frame.default(formula = y ~ x, drop.unused.levels = TRUE) :
invalid type (list) for variable 'x'
Je reçois une erreur car la fonction lm() ne peut prendre que des vecteurs en entrée et la variable x est actuellement une liste.
Comment éviter l’erreur
Le moyen le plus simple d’éviter cette erreur est d’utiliser simplement la fonction unlist() pour convertir la variable de liste en vecteur :
#define variables
x <- list(1, 4, 4, 5, 7, 8, 9, 10, 13, 14)
y <- c(10, 13, 13, 14, 18, 20, 22, 24, 29, 31)
#attempt to fit regression model
model <- lm(y ~ unlist(x))
#view the model output
summary(model)
Call:
lm(formula = y ~ unlist(x))
Residuals:
Min 1Q Median 3Q Max
-1.1282 -0.4194 -0.1087 0.2966 1.7068
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 6.58447 0.55413 11.88 2.31e-06 ***
unlist(x) 1.70874 0.06544 26.11 4.97e-09 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 0.8134 on 8 degrees of freedom
Multiple R-squared: 0.9884, Adjusted R-squared: 0.987
F-statistic: 681.8 on 1 and 8 DF, p-value: 4.97e-09
Notez que nous sommes capables d’adapter le modèle de régression linéaire simple sans aucune erreur cette fois-ci car nous avons utilisé unlist() pour convertir la variable x en vecteur.
Notez que si vous ajustez un modèle de régression linéaire multiple et que vous disposez de plusieurs variables prédictives qui sont actuellement des objets de liste, vous pouvez utiliser unlist() pour convertir chacune d’elles en vecteurs avant d’ajuster le modèle de régression :
#define variables
x1 <- list(1, 4, 4, 5, 7, 8, 9, 10, 13, 14)
x2 <- list(20, 16, 16, 15, 16, 12, 10, 8, 8, 4)
y <- c(10, 13, 13, 14, 18, 20, 22, 24, 29, 31)
#fit multiple linear regression model
model <- lm(y ~ unlist(x1) + unlist(x2))
#view the model output
summary(model)
Call:
lm(formula = y ~ unlist(x1) + unlist(x2))
Residuals:
Min 1Q Median 3Q Max
-1.1579 -0.4211 -0.1386 0.3108 1.7130
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 8.34282 4.44971 1.875 0.102932
unlist(x1) 1.61339 0.24899 6.480 0.000341 ***
unlist(x2) -0.08346 0.20937 -0.399 0.702044
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 0.8599 on 7 degrees of freedom
Multiple R-squared: 0.9887, Adjusted R-squared: 0.9854
F-statistic: 305.1 on 2 and 7 DF, p-value: 1.553e-07
Encore une fois, nous ne recevons aucune erreur puisque nous avons converti chacun des objets de la liste en vecteurs.
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes dans R :
Comment interpréter la sortie glm dans R
Comment interpréter les résultats de l’ANOVA dans R
Comment gérer R Avertissement : glm.fit : l’algorithme n’a pas convergé