Comment réparer dans R : dim(X) doit avoir une longueur positive
Une erreur que vous pouvez rencontrer dans R est :
Error in apply(df$var1, 2, mean) : dim(X) must have a positive length
Cette erreur se produit lorsque vous tentez d’utiliser la fonction apply() pour calculer une métrique pour une colonne d’un bloc de données ou d’une matrice, tout en fournissant un vecteur comme argument au lieu d’un bloc de données ou d’une matrice.
Ce didacticiel explique exactement comment corriger cette erreur.
Comment reproduire l’erreur
Supposons que nous ayons le bloc de données suivant dans R :
#create data frame
df <- data.frame(points=c(99, 97, 104, 79, 84, 88, 91, 99),
rebounds=c(34, 40, 41, 38, 29, 30, 22, 25),
blocks=c(12, 8, 8, 7, 8, 11, 6, 7))
#view data frame
df
points rebounds blocks
1 99 34 12
2 97 40 8
3 104 41 8
4 79 38 7
5 84 29 8
6 88 30 11
7 91 22 6
8 99 25 7
Supposons maintenant que nous essayions d’utiliser la fonction apply() pour calculer la valeur moyenne dans la colonne « points » :
#attempt to calculate mean of 'points' column
apply(df$points, 2, mean)
Error in apply(df$points, 2, mean) : dim(X) must have a positive length
Une erreur se produit car la fonction apply() doit être appliquée à un bloc de données ou à une matrice, mais dans cet exemple, nous essayons de l’appliquer à une colonne spécifique du bloc de données.
Comment réparer l’erreur
La façon de corriger cette erreur consiste simplement à fournir le nom du bloc de données à la fonction apply() comme suit :
#calculate mean of every column in data frame
apply(df, 2, mean)
points rebounds blocks
92.625 32.375 8.375
À partir de la sortie, nous pouvons voir la valeur moyenne de chaque colonne du bloc de données. Par exemple, la valeur moyenne de la colonne « points » est de 92,625 .
Nous pouvons également utiliser cette fonction pour trouver uniquement la moyenne de valeurs spécifiques dans le bloc de données :
#calculate mean of 'points' and 'blocks' column in data frame
apply(df[c('points', 'blocks')], 2, mean)
points blocks
92.625 8.375
Enfin, si nous souhaitons trouver la moyenne d’une seule colonne, nous pouvons utiliser la fonction Mean() sans utiliser du tout la fonction apply() :
#calculate mean of 'points' column
mean(df$points)
[1] 92.625
Ressources additionnelles
Les didacticiels suivants expliquent comment résoudre d’autres erreurs courantes dans R :
Comment réparer dans R : les noms ne correspondent pas aux noms précédents
Comment réparer dans R : la longueur d’un objet plus longue n’est pas un multiple de la longueur d’un objet plus courte
Comment réparer dans R : les contrastes ne peuvent être appliqués qu’à des facteurs avec 2 niveaux ou plus