Hoe op te lossen: fout in do_one(nmeth): na/nan/inf in externe functieaanroep (arg 1)
Een fout die je tegen kunt komen in R is:
Error in do_one(nmeth): NA/NaN/Inf in foreign function call (arg 1)
Deze fout treedt op wanneer u probeert k-means-clustering uit te voeren in R , maar het dataframe dat u gebruikt bevat een of meer ontbrekende waarden.
In deze tutorial wordt precies uitgelegd hoe u deze fout kunt oplossen.
Hoe de fout te reproduceren
Stel dat we het volgende dataframe in R hebben met een ontbrekende waarde in de tweede rij:
#create data frame df <- data. frame (var1=c(2, 4, 4, 6, 7, 8, 8, 9, 9, 12), var2=c(12, 14, 14, 8, 8, 15, 16, 9, 9, 11), var3=c(22, NA, 23, 24, 28, 23, 19, 16, 12, 15)) row. names (df) <- LETTERS[1:10] #view data frame df var1 var2 var3 At 2 12 22 B 4 14 NA C 4 14 23 D 6 8 24 E 7 8 28 F 8 15 23 G 8 16 19 H 9 9 16 I 9 9 12 D 12 11 15
Als we de functie kmeans() proberen te gebruiken om k-means clustering uit te voeren op dit dataframe, krijgen we een foutmelding:
#attempt to perform k-means clustering with k = 3 clusters km <- kmeans(df, centers = 3 ) Error in do_one(nmeth): NA/NaN/Inf in foreign function call (arg 1)
Hoe u de fout kunt oplossen
De eenvoudigste manier om deze fout op te lossen is door eenvoudigweg de functie na.omit() te gebruiken om rijen met ontbrekende waarden uit het dataframe te verwijderen:
#remove rows with NA values df <- na. omitted (df) #perform k-means clustering with k = 3 clusters km <- kmeans(df, centers = 3) #view results km K-means clustering with 3 clusters of sizes 4, 3, 2 Cluster means: var1 var2 var3 1 5.5 14.250000 21.75000 2 10.0 9.666667 14.33333 3 6.5 8.000000 26.00000 Vector clustering: ACDEFGHIJ 1 1 3 3 1 1 2 2 2 Within cluster sum of squares by cluster: [1] 46.50000 17.33333 8.50000 (between_SS / total_SS = 79.5%) Available components: [1] "cluster" "centers" "totss" "withinss" "tot.withinss" [6] "betweenss" "size" "iter" "ifault"
Merk op dat het k-means clusteringalgoritme succesvol wordt uitgevoerd zodra we de rijen met ontbrekende waarden uit het dataframe verwijderen.
Bonus: een complete stap-voor-stap handleiding voor k-betekent clustering in R
Aanvullende bronnen
Hoe op te lossen in R: NA’s geïntroduceerd door dwang
Hoe te repareren in R: index buiten bereik
Hoe op te lossen in R: de lengte van een langer object is geen veelvoud van de lengte van een korter object