So finden und zählen sie fehlende werte in r (mit beispielen)


Sie können die folgenden Methoden verwenden, um fehlende Werte in R zu finden und zu zählen:

Methode 1: Finden Sie den Ort fehlender Werte

 which( is.na (df$column_name))

Methode 2: Zählen Sie die gesamten fehlenden Werte

 sum( is.na (df$column_name))

Die folgenden Beispiele zeigen, wie Sie diese Funktionen in der Praxis nutzen können.

Beispiel 1: Fehlende Werte in einer Spalte suchen und zählen

Angenommen, wir haben den folgenden Datenrahmen:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', NA, 'E'),
                 points=c(99, 90, 86, 88, 95),
                 assists=c(NA, 28, NA, NA, 34),
                 rebounds=c(30, 28, 24, 24, NA))

#view data frame
df

  team points assists rebounds
1 A 99 NA 30
2 B 90 28 28
3 C 86 NA 24
4 NA 88 NA 24
5 E 95 34 NA

Wir können den folgenden Code verwenden, um Positionen zu identifizieren, bei denen in der Spalte „Assist“ fehlende Werte vorhanden sind, und um die gesamten fehlenden Werte in der Spalte „Assist“ zu ermitteln:

 #identify locations of missing values in 'assists' column
which( is.na (df$assists))

[1] 1 3 4

#count total missing values in 'assists' column
sum( is.na (df$assists))

[1] 3 

Aus dem Ergebnis können wir erkennen, dass die Positionen 1 , 3 und 4 fehlende Werte in der Spalte „Assists“ aufweisen und insgesamt 3 fehlende Werte in der Spalte vorhanden sind.

Beispiel 2: Fehlende Werte in allen Spalten zählen

Der folgende Code zeigt, wie die gesamten fehlenden Werte in jeder Spalte eines Datenrahmens gezählt werden:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', NA, 'E'),
                 points=c(99, 90, 86, 88, 95),
                 assists=c(NA, 28, NA, NA, 34),
                 rebounds=c(30, 28, 24, 24, NA))

#count total missing values in each column of data frame
sapply(df, function (x) sum(is. na (x)))

    team points assists rebounds 
       1 0 3 1

Aus dem Ergebnis können wir sehen:

  • In der Spalte „Team“ fehlt 1 Wert.
  • Die Spalte „Punkte“ enthält 0 fehlende Werte.
  • In der Spalte „Unterstützung“ fehlen drei Werte.
  • In der Spalte „Rebounds“ fehlt 1 Wert.

Beispiel 3: Fehlende Werte im gesamten Datenrahmen zählen

Der folgende Code zeigt, wie die gesamten fehlenden Werte in einem gesamten Datenrahmen gezählt werden:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', NA, 'E'),
                 points=c(99, 90, 86, 88, 95),
                 assists=c(NA, 28, NA, NA, 34),
                 rebounds=c(30, 28, 24, 24, NA))

#count total missing values in entire data frame
sum( is.na (df))

[1] 5

Aus dem Ergebnis können wir ersehen, dass im gesamten Datenrahmen insgesamt 5 Werte fehlen.

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere gängige Operationen mit fehlenden Werten in R durchführen:

Wie alle fehlenden Werte in R unterstellt werden
So ersetzen Sie NAs durch Strings in R
So ersetzen Sie NA durch Zero in dplyr

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert