R에서 complete.cases를 사용하는 방법(예제 포함)


R의 Complete.cases() 함수를 사용하여 벡터, 행렬 또는 데이터 프레임에서 누락된 값을 제거할 수 있습니다.

이 함수는 다음 기본 구문을 사용합니다.

 #remove missing values from vector
x <- x[complete. boxes (x)]

#remove rows with missing values in any column of data frame
df <- df[complete. boxes (df), ]

#remove rows with NA in specific columns of data frame
df <- df[complete. cases (df[, c(' col1 ', ' col2 ', ...)]), ] 

다음 예에서는 이 기능을 실제로 사용하는 방법을 보여줍니다.

예시 1: 벡터에서 누락된 값 제거

다음 코드는 벡터에서 모든 NA 값을 제거하는 방법을 보여줍니다.

 #definevector
x <- c(1, 24, NA, 6, NA, 9)

#remove NA values from vector
x <- x[complete. boxes (x)]

x

[1] 1 24 6 9

예 2: 데이터 프레임의 모든 열에서 NA가 있는 행 삭제

다음 코드는 데이터 프레임의 모든 열에서 NA 값이 있는 행을 제거하는 방법을 보여줍니다.

 #define data frame
df <- data. frame (x=c(1, 24, NA, 6, NA, 9),
                 y=c(NA, 3, 4, 8, NA, 12),
                 z=c(NA, 7, 5, 15, 7, 14))

#view data frame
df

   X Y Z
1 1 NA NA
2 24 3 7
3 NA 4 5
4 6 8 15
5 NA NA 7
6 9 12 14

#remove rows with NA value in any column data frame
df <- df[complete. boxes (df), ]

#view data frame 
df

   X Y Z
2 24 3 7
4 6 8 15
6 9 12 14

예시 3: 데이터 프레임의 특정 열에서 NA가 있는 행 삭제

다음 코드는 데이터 프레임의 특정 열에서 NA 값이 있는 행을 삭제하는 방법을 보여줍니다.

 #define data frame
df <- data. frame (x=c(1, 24, NA, 6, NA, 9),
                 y=c(NA, 3, 4, 8, NA, 12),
                 z=c(NA, 7, 5, 15, 7, 14))

#view data frame
df

   X Y Z
1 1 NA NA
2 24 3 7
3 NA 4 5
4 6 8 15
5 NA NA 7
6 9 12 14

#remove rows with NA value in y or z column
df <- df[complete. cases (df[, c(' y ', ' z ')]), ]

#view data frame 
df

   X Y Z
2 24 3 7
3 NA 4 5
4 6 8 15
6 9 12 14

추가 리소스

R에서 “NA가 아님”을 사용하는 방법
R에서 결측값을 모두 대치하는 방법
R에서 NA를 문자열로 바꾸는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다