A: drop_na를 사용하여 누락된 값이 있는 행을 삭제하는 방법


R의 Tidyr 패키지에 있는 drop_na() 함수를 사용하여 데이터 프레임에서 누락된 값이 있는 행을 삭제할 수 있습니다.

이 기능을 사용하는 세 가지 일반적인 방법은 다음과 같습니다.

방법 1: 임의의 열에서 누락된 값이 있는 행 제거

 df %>% drop_na()

방법 2: 특정 열에서 누락된 값이 있는 행 제거

 df %>% drop_na(col1)

방법 3: 여러 특정 열 중 하나에서 누락된 값이 있는 행 제거

 df %>% drop_na(c(col1, col2))

다음 예에서는 다음 데이터 프레임에서 이러한 각 방법을 실제로 사용하는 방법을 보여줍니다.

 #create data frame
df <- data. frame (points=c(10, NA, 15, 15, 14, 16),
                 assists=c(4, NA, 4, NA, 9, 3),
                 rebounds=c(NA, 5, 10, 7, 7, NA))

#view data frame
df

  points assists rebounds
1 10 4 NA
2 NA NA 5
3 15 4 10
4 15 NA 7
5 14 9 7
6 16 3 NA

예시 1: 임의의 열에서 누락된 값이 있는 행 삭제

다음 코드는 drop_na()를 사용하여 모든 열에서 누락된 값이 있는 행을 삭제하는 방법을 보여줍니다.

 library (tidyr)

#drop rows with missing values in any column
df %>% drop_na()

  points assists rebounds
1 15 4 10
2 14 9 7

남은 유일한 행은 어떤 열에도 누락된 값이 포함되지 않은 행입니다.

예시 2: 특정 열에서 누락된 값이 있는 행 제거

다음 코드는 drop_na()를 사용하여 반송 열에서 누락된 값이 있는 행을 제거하는 방법을 보여줍니다.

 library (tidyr)

#drop rows with missing values in rebounds column
df %>% drop_na(rebounds)

  points assists rebounds
1 NA NA 5
2 15 4 10
3 15 NA 7
4 14 9 7

남은 유일한 행은 반송 열에 누락된 값이 없는 행입니다.

예시 3: 여러 특정 열 중 하나에서 누락된 값이 있는 행 삭제

다음 코드는 drop_na()를 사용하여 포인트 또는 어시스트 열에서 누락된 값이 있는 행을 삭제하는 방법을 보여줍니다.

 library (tidyr)

#drop rows with missing values in the points or assists columns
df %>% drop_na(c(points, assists))

  points assists rebounds
1 10 4 NA
2 15 4 10
3 14 9 7
4 16 3 NA

남은 행은 포인트 어시스트 열에 누락된 값이 없는 행뿐입니다.

참고: 여기에서 drop_na() 메서드에 대한 전체 온라인 설명서를 찾을 수 있습니다.

추가 리소스

다음 튜토리얼에서는 R에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

R에서 줄 번호를 검색하는 방법
R의 데이터 프레임에 행을 추가하는 방법
R에서 데이터 프레임의 각 행에 함수를 적용하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다