Come risolvere: errore in do_one(nmeth): na/nan/inf nella chiamata di funzione esterna (arg 1)

Di Benjamin anderson Luglio 24, 2023 Guida 0 commenti

Un errore che potresti riscontrare in R è:

 Error in do_one(nmeth): NA/NaN/Inf in foreign function call (arg 1)

Questo errore si verifica quando si tenta di eseguireil clustering k-means in R ma il frame di dati in uso presenta uno o più valori mancanti.

Questo tutorial spiega esattamente come correggere questo errore.

Come riprodurre l’errore

Supponiamo di avere il seguente frame di dati in R con un valore mancante nella seconda riga:

 #create data frame
df <- data. frame (var1=c(2, 4, 4, 6, 7, 8, 8, 9, 9, 12),
                 var2=c(12, 14, 14, 8, 8, 15, 16, 9, 9, 11),
                 var3=c(22, NA, 23, 24, 28, 23, 19, 16, 12, 15))

row. names (df) <- LETTERS[1:10]

#view data frame
df

  var1 var2 var3
At 2 12 22
B 4 14 NA
C 4 14 23
D 6 8 24
E 7 8 28
F 8 15 23
G 8 16 19
H 9 9 16
I 9 9 12
D 12 11 15

Se proviamo a utilizzare la funzione kmeans() per eseguire il clustering k-means su questo frame di dati, riceveremo un errore:

 #attempt to perform k-means clustering with k = 3 clusters
km <- kmeans(df, centers = 3 )

Error in do_one(nmeth): NA/NaN/Inf in foreign function call (arg 1)

Come correggere l’errore

Il modo più semplice per correggere questo errore è utilizzare semplicemente la funzione na.omit() per rimuovere le righe con valori mancanti dal frame di dati:

 #remove rows with NA values
df <- na. omitted (df)

#perform k-means clustering with k = 3 clusters
km <- kmeans(df, centers = 3)

#view results
km

K-means clustering with 3 clusters of sizes 4, 3, 2

Cluster means:
  var1 var2 var3
1 5.5 14.250000 21.75000
2 10.0 9.666667 14.33333
3 6.5 8.000000 26.00000

Vector clustering:
ACDEFGHIJ
1 1 3 3 1 1 2 2 2 

Within cluster sum of squares by cluster:
[1] 46.50000 17.33333 8.50000
 (between_SS / total_SS = 79.5%)

Available components:

[1] "cluster" "centers" "totss" "withinss" "tot.withinss"
[6] "betweenss" "size" "iter" "ifault"

Tieni presente che l’algoritmo di clustering k-means viene eseguito correttamente una volta rimosse le righe con valori mancanti dal frame di dati.

Bonus:una guida passo passo completa al clustering k-means in R

Risorse addizionali

Come risolvere in R: NA introdotte dalla coercizione
Come riparare in R: indice fuori limite
Come risolvere in R: la lunghezza di un oggetto più lungo non è un multiplo della lunghezza di un oggetto più corto

Informazioni sull'autore

Benjamin anderson

Ciao, sono Benjamin, un professore di statistica in pensione diventato insegnante dedicato di Statorials. Con una vasta esperienza e competenza nel campo della statistica, sono ansioso di condividere le mie conoscenze per potenziare gli studenti attraverso Statorials. Scopri di più

Come riprodurre l’errore

Come correggere l’errore

Risorse addizionali

Informazioni sull'autore

Benjamin anderson

Aggiungi un commento