Verwendung von na.omit in r (mit beispielen)


Sie können die Funktion na.omit() in R verwenden, um alle unvollständigen Fälle in einem Vektor, einer Matrix oder einem Datenrahmen zu entfernen.

Diese Funktion verwendet die folgende grundlegende Syntax:

 #omit NA values from vector
x <- na. omitted (x)

#omit rows with NA in any column of data frame
df <- na. omitted (df)

#omit rows with NA in specific column of data frame
df <- df[ ! (is. na (df$column)), ]

Die folgenden Beispiele zeigen, wie Sie diese Funktion in der Praxis nutzen können.

Beispiel 1: NA-Werte aus dem Vektor weglassen

Der folgende Code zeigt, wie alle NA-Werte aus einem Vektor weggelassen werden:

 #definevector
x <- c(1, 24, NA, 6, NA, 9)

#omit NA values from vector
x <- na. omitted (x)

x

[1] 1 24 6 9
attr(,"na.action")
[1] 3 5
attr(,"class")
[1] “omitted”

Die erste Zeile der Ausgabe zeigt den Vektor ohne NA-Werte an, während die nächsten beiden Zeilen zusätzliche Informationen über die Position der NA-Werte anzeigen.

Wir können den folgenden Code verwenden, um einfach den Vektor ohne die NA-Werte zurückzugeben:

 #definevector
x <- c(1, 24, NA, 6, NA, 9)

#omit NA values from vector
x <- as. numeric (na. omit (x))

x

[1] 1 24 6 9

Beispiel 2: Zeilen mit NA in jeder Spalte des Datenrahmens weglassen

Der folgende Code zeigt, wie alle Zeilen mit NA-Werten in einer beliebigen Spalte eines Datenrahmens weggelassen werden:

 #define data frame
df <- data. frame (x=c(1, 24, NA, 6, NA, 9),
                 y=c(NA, 3, 4, 8, NA, 12),
                 z=c(NA, 7, 5, 15, 7, 14))

#view data frame
df

   X Y Z
1 1 NA NA
2 24 3 7
3 NA 4 5
4 6 8 15
5 NA NA 7
6 9 12 14

#omit rows with NA value in any column data frame
df <- na. omitted (df)

#view data frame 
df

   X Y Z
2 24 3 7
4 6 8 15
6 9 12 14

Beispiel 3: Zeilen mit NA in einer bestimmten Spalte des Datenrahmens weglassen

Um Zeilen mit NA-Werten in einer bestimmten Spalte eines Datenrahmens wegzulassen, ist es tatsächlich einfacher, die Funktion is.na() wie folgt zu verwenden:

 #define data frame
df <- data. frame (x=c(1, 24, NA, 6, NA, 9),
                 y=c(NA, 3, 4, 8, NA, 12),
                 z=c(NA, 7, 5, 15, 7, 14))

#view data frame
df

   X Y Z
1 1 NA NA
2 24 3 7
3 NA 4 5
4 6 8 15
5 NA NA 7
6 9 12 14

#remove rows with NA value in x column
df <- df[ ! (is. na (df$x)), ]

#view data frame 
df

   X Y Z
1 1 NA NA
2 24 3 7
4 6 8 15
6 9 12 14

Zusätzliche Ressourcen

Wie man „Ist nicht NA“ in R verwendet
So verwenden Sie is.null in R
Wie alle fehlenden Werte in R unterstellt werden
So ersetzen Sie NAs durch Strings in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert