Hoe op te lossen in r: ongeldig type (lijst) voor variabele
Een fout die je tegen kunt komen in R is:
Error in model.frame.default(formula = y ~ x, drop.unused.levels = TRUE): invalid type (list) for variable 'x'
Deze fout treedt meestal op wanneer u probeert een regressiemodel of ANOVA-model in R te passen en een lijst voor een van de variabelen gebruikt in plaats van een vector .
In deze tutorial wordt uitgelegd hoe u deze fout in de praktijk kunt oplossen.
Hoe de fout te reproduceren
Stel dat ik een eenvoudig lineair regressiemodel in R probeer te passen:
#define variables
x <- list(1, 4, 4, 5, 7, 8, 9, 10, 13, 14)
y <- c(10, 13, 13, 14, 18, 20, 22, 24, 29, 31)
#attempt to fit regression model
model <- lm(y ~ x)
Error in model.frame.default(formula = y ~ x, drop.unused.levels = TRUE):
invalid type (list) for variable 'x'
Ik krijg een foutmelding omdat de functie lm() alleen vectoren als invoer kan gebruiken en de variabele x momenteel een lijst is.
Hoe u de fout kunt vermijden
De eenvoudigste manier om deze fout te voorkomen is door eenvoudigweg de functie unlist() te gebruiken om de lijstvariabele naar een vector te converteren:
#define variables
x <- list(1, 4, 4, 5, 7, 8, 9, 10, 13, 14)
y <- c(10, 13, 13, 14, 18, 20, 22, 24, 29, 31)
#attempt to fit regression model
model <- lm(y ~ unlist(x))
#view the model output
summary(model)
Call:
lm(formula = y ~ unlist(x))
Residuals:
Min 1Q Median 3Q Max
-1.1282 -0.4194 -0.1087 0.2966 1.7068
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 6.58447 0.55413 11.88 2.31e-06 ***
unlist(x) 1.70874 0.06544 26.11 4.97e-09 ***
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 0.8134 on 8 degrees of freedom
Multiple R-squared: 0.9884, Adjusted R-squared: 0.987
F-statistic: 681.8 on 1 and 8 DF, p-value: 4.97e-09
Merk op dat we het eenvoudige lineaire regressiemodel deze keer zonder fouten kunnen aanpassen, omdat we unlist() hebben gebruikt om de variabele x naar een vector te converteren.
Houd er rekening mee dat als u een meervoudig lineair regressiemodel aanpast en u meerdere voorspellingsvariabelen hebt die momenteel lijstobjecten zijn, u unlist() kunt gebruiken om elk daarvan naar vectoren te converteren voordat u het regressiemodel aanpast:
#define variables
x1 <- list(1, 4, 4, 5, 7, 8, 9, 10, 13, 14)
x2 <- list(20, 16, 16, 15, 16, 12, 10, 8, 8, 4)
y <- c(10, 13, 13, 14, 18, 20, 22, 24, 29, 31)
#fit multiple linear regression model
model <- lm(y ~ unlist(x1) + unlist(x2))
#view the model output
summary(model)
Call:
lm(formula = y ~ unlist(x1) + unlist(x2))
Residuals:
Min 1Q Median 3Q Max
-1.1579 -0.4211 -0.1386 0.3108 1.7130
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 8.34282 4.44971 1.875 0.102932
unlist(x1) 1.61339 0.24899 6.480 0.000341 ***
unlist(x2) -0.08346 0.20937 -0.399 0.702044
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 0.8599 on 7 degrees of freedom
Multiple R-squared: 0.9887, Adjusted R-squared: 0.9854
F-statistic: 305.1 on 2 and 7 DF, p-value: 1.553e-07
Nogmaals, we ontvangen geen fouten omdat we elk van de objecten in de lijst naar vectoren hebben geconverteerd.
Aanvullende bronnen
In de volgende zelfstudies wordt uitgelegd hoe u andere veelvoorkomende bewerkingen in R uitvoert:
Hoe GLM-uitvoer in R te interpreteren
Hoe ANOVA-resultaten in R te interpreteren
Hoe om te gaan met R Waarschuwing: glm.fit: algoritme is niet geconvergeerd