Comment réparer : erreur dans strsplit(unitspec, ” “) : argument sans caractère
Une erreur que vous pouvez rencontrer dans R est :
Error in strsplit(df$my_column, split = "1") : non-character argument
Cette erreur se produit généralement lorsque vous essayez d’utiliser la fonction strsplit() dans R pour diviser une chaîne, alors que l’objet avec lequel vous travaillez n’est pas une chaîne.
Ce didacticiel explique exactement comment corriger cette erreur.
Comment reproduire l’erreur
Supposons que nous ayons le bloc de données suivant dans R :
#create data frame df <- data.frame(team=c('A', 'B', 'C'), points=c(91910, 14015, 120215)) #view data frame df team points 1 A 91910 2 B 14015 3 C 120215
Supposons maintenant que nous essayions d’utiliser la fonction strsplit() pour diviser les valeurs dans la colonne « points » en fonction de l’endroit où le chiffre 1 apparaît :
#attempt to split values in points column
strsplit(df$points, split="1")
Error in strsplit(df$points, split = "1") : non-character argument
Nous recevons une erreur car la variable « points » n’est pas un caractère.
Nous pouvons le confirmer en vérifiant la classe de cette variable :
#display class of "points" variable
class(df$points)
[1] "numeric"
Nous pouvons voir que cette variable a une classe numérique.
Comment réparer l’erreur
La façon de corriger cette erreur est d’utiliser as.character() pour convertir la variable « points » en caractère avant d’essayer d’utiliser la fonction strsplit() :
#split values in points column based on where 1 appears
strsplit(as.character(df$points), split="1")
[[1]]
[1] "9" "9" "0"
[[2]]
[1] "" "40" "5"
[[3]]
[1] "" "202" "5"
Cette fois, nous avons réussi à diviser chaque valeur dans la colonne « points » car nous avons d’abord utilisé la fonction as.character() pour convertir les « points » en caractère.
Ressources additionnelles
Les didacticiels suivants expliquent comment résoudre d’autres erreurs courantes dans R :
Comment réparer dans R : les noms ne correspondent pas aux noms précédents
Comment réparer dans R : plus de colonnes que de noms de colonnes
Comment réparer dans R : le remplacement a X lignes, les données ont Y