A: drop_na를 사용하여 누락된 값이 있는 행을 삭제하는 방법
R의 Tidyr 패키지에 있는 drop_na() 함수를 사용하여 데이터 프레임에서 누락된 값이 있는 행을 삭제할 수 있습니다.
이 기능을 사용하는 세 가지 일반적인 방법은 다음과 같습니다.
방법 1: 임의의 열에서 누락된 값이 있는 행 제거
df %>% drop_na()
방법 2: 특정 열에서 누락된 값이 있는 행 제거
df %>% drop_na(col1)
방법 3: 여러 특정 열 중 하나에서 누락된 값이 있는 행 제거
df %>% drop_na(c(col1, col2))
다음 예에서는 다음 데이터 프레임에서 이러한 각 방법을 실제로 사용하는 방법을 보여줍니다.
#create data frame df <- data. frame (points=c(10, NA, 15, 15, 14, 16), assists=c(4, NA, 4, NA, 9, 3), rebounds=c(NA, 5, 10, 7, 7, NA)) #view data frame df points assists rebounds 1 10 4 NA 2 NA NA 5 3 15 4 10 4 15 NA 7 5 14 9 7 6 16 3 NA
예시 1: 임의의 열에서 누락된 값이 있는 행 삭제
다음 코드는 drop_na()를 사용하여 모든 열에서 누락된 값이 있는 행을 삭제하는 방법을 보여줍니다.
library (tidyr)
#drop rows with missing values in any column
df %>% drop_na()
points assists rebounds
1 15 4 10
2 14 9 7
남은 유일한 행은 어떤 열에도 누락된 값이 포함되지 않은 행입니다.
예시 2: 특정 열에서 누락된 값이 있는 행 제거
다음 코드는 drop_na()를 사용하여 반송 열에서 누락된 값이 있는 행을 제거하는 방법을 보여줍니다.
library (tidyr)
#drop rows with missing values in rebounds column
df %>% drop_na(rebounds)
points assists rebounds
1 NA NA 5
2 15 4 10
3 15 NA 7
4 14 9 7
남은 유일한 행은 반송 열에 누락된 값이 없는 행입니다.
예시 3: 여러 특정 열 중 하나에서 누락된 값이 있는 행 삭제
다음 코드는 drop_na()를 사용하여 포인트 또는 어시스트 열에서 누락된 값이 있는 행을 삭제하는 방법을 보여줍니다.
library (tidyr)
#drop rows with missing values in the points or assists columns
df %>% drop_na(c(points, assists))
points assists rebounds
1 10 4 NA
2 15 4 10
3 14 9 7
4 16 3 NA
남은 행은 포인트 나 어시스트 열에 누락된 값이 없는 행뿐입니다.
참고: 여기에서 drop_na() 메서드에 대한 전체 온라인 설명서를 찾을 수 있습니다.
추가 리소스
다음 튜토리얼에서는 R에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.
R에서 줄 번호를 검색하는 방법
R의 데이터 프레임에 행을 추가하는 방법
R에서 데이터 프레임의 각 행에 함수를 적용하는 방법