R에서 목록별 삭제를 수행하는 방법(예제 포함)
목록별 삭제는 열에 누락된 값이 있는 데이터 프레임의 모든 행을 삭제하는 방법입니다.
R에서 목록별 삭제를 수행하는 가장 쉬운 방법은 다음 구문을 사용하는 것입니다.
complete_df <- df[complete. boxes (df), ]
이 구문은 Complete.cases() 함수를 사용하여 열에 누락된 값이 없는 원본 데이터 프레임의 행만 포함하는 새 데이터 프레임을 만듭니다.
다음 예에서는 이 기능을 실제로 사용하는 방법을 보여줍니다.
예: R에서 목록별 삭제 수행
다양한 농구 선수에 대한 정보를 포함하는 다음과 같은 데이터 프레임이 R에 있다고 가정합니다.
#create data frame df <- data. frame (rating=c(70, 75, 75, 78, 81, 85, 89, 91, 94, 97), points=c(12, 15, 14, 13, NA, 29, 24, 18, 20, 25), assists=c(9, 5, NA, 5, 7, 8, 11, 12, 13, 11)) #view data frame df rating points assists 1 70 12 9 2 75 15 5 3 75 14 NA 4 78 13 5 5 81 NA 7 6 85 29 8 7 89 24 11 8 91 18 12 9 94 20 13 10 97 25 11
두 행의 일부 열에는 NA 값이 포함되어 있습니다.
다음 구문을 사용하여 목록별 삭제를 수행하고 모든 열에 누락된 값이 없는 행만 유지할 수 있습니다.
#create new data frame that only contains rows with no missing values complete_df <- df[complete. boxes (df), ] #view new data frame complete_df rating points assists 1 70 12 9 2 75 15 5 4 78 13 5 6 85 29 8 7 89 24 11 8 91 18 12 9 94 20 13 10 97 25 11
이 새로운 데이터 프레임의 행 중 어떤 열에도 빈 값이 없다는 점에 유의하세요.
또한 nrow() 함수를 사용하여 원래 데이터 프레임의 열에 누락된 값이 있는 행 수를 확인할 수 있습니다.
#count how many rows have missing values in any column nrow(df[ ! complete. cases (df), ]) [1] 2
이는 원본 데이터 프레임의 2 개 행 중 적어도 하나의 열에 누락된 값이 있음을 알려줍니다.
그리고 어떤 열에도 누락된 값이 없는 행 수를 쉽게 계산할 수 있습니다.
#count how many rows do not have missing values in any column nrow(df[complete. cases (df), ]) [1] 8
이는 원본 데이터 프레임의 8 개 행에 어떤 열에도 누락된 값이 없음을 알려줍니다.
추가 리소스
다음 튜토리얼에서는 R에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.