Comment réparer dans R : dim(X) doit avoir une longueur positive



Une erreur que vous pouvez rencontrer dans R est :

Error in apply(df$var1, 2, mean) : dim(X) must have a positive length 

Cette erreur se produit lorsque vous tentez d’utiliser la fonction apply() pour calculer une métrique pour une colonne d’un bloc de données ou d’une matrice, tout en fournissant un vecteur comme argument au lieu d’un bloc de données ou d’une matrice.

Ce didacticiel explique exactement comment corriger cette erreur.

Comment reproduire l’erreur

Supposons que nous ayons le bloc de données suivant dans R :

#create data frame
df <- data.frame(points=c(99, 97, 104, 79, 84, 88, 91, 99),
                 rebounds=c(34, 40, 41, 38, 29, 30, 22, 25),
                 blocks=c(12, 8, 8, 7, 8, 11, 6, 7))

#view data frame
df

  points rebounds blocks
1     99       34     12
2     97       40      8
3    104       41      8
4     79       38      7
5     84       29      8
6     88       30     11
7     91       22      6
8     99       25      7

Supposons maintenant que nous essayions d’utiliser la fonction apply() pour calculer la valeur moyenne dans la colonne « points » :

#attempt to calculate mean of 'points' column
apply(df$points, 2, mean)

Error in apply(df$points, 2, mean) : dim(X) must have a positive length

Une erreur se produit car la fonction apply() doit être appliquée à un bloc de données ou à une matrice, mais dans cet exemple, nous essayons de l’appliquer à une colonne spécifique du bloc de données.

Comment réparer l’erreur

La façon de corriger cette erreur consiste simplement à fournir le nom du bloc de données à la fonction apply() comme suit :

#calculate mean of every column in data frame
apply(df, 2, mean)

  points rebounds   blocks 
  92.625   32.375    8.375 

À partir de la sortie, nous pouvons voir la valeur moyenne de chaque colonne du bloc de données. Par exemple, la valeur moyenne de la colonne « points » est de 92,625 .

Nous pouvons également utiliser cette fonction pour trouver uniquement la moyenne de valeurs spécifiques dans le bloc de données :

#calculate mean of 'points' and 'blocks' column in data frame
apply(df[c('points', 'blocks')], 2, mean)

points blocks 
92.625  8.375

Enfin, si nous souhaitons trouver la moyenne d’une seule colonne, nous pouvons utiliser la fonction Mean() sans utiliser du tout la fonction apply() :

#calculate mean of 'points' column
mean(df$points)

[1] 92.625

Ressources additionnelles

Les didacticiels suivants expliquent comment résoudre d’autres erreurs courantes dans R :

Comment réparer dans R : les noms ne correspondent pas aux noms précédents
Comment réparer dans R : la longueur d’un objet plus longue n’est pas un multiple de la longueur d’un objet plus courte
Comment réparer dans R : les contrastes ne peuvent être appliqués qu’à des facteurs avec 2 niveaux ou plus

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *