A: 각 열의 na 값 수를 계산합니다.


다음 방법을 사용하여 R에서 데이터 프레임의 각 열에 있는 NA 값의 수를 계산할 수 있습니다.

방법 1: 기본 R을 사용하여 각 열의 NA 값 계산

 sapply(df, function (x) sum(is. na (x)))

방법 2: dplyr을 사용하여 각 열의 NA 값 계산

 library (dplyr)

df %>% summarise(across(everything(), ~ sum(is. na (.))))

다음 예에서는 R의 다음 데이터 프레임과 함께 각 메서드를 사용하는 방법을 보여줍니다.

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E'),
                 points=c(99, 90, 86, 88, NA),
                 assists=c(33, NA, NA, 39, 34),
                 rebounds=c(30, 28, 24, 24, 28))

#view data frame
df

  team points assists rebounds
1 A 99 33 30
2 B 90 NA 28
3 C 86 NA 24
4 D 88 39 24
5 E NA 34 28

예시 1: 기본 R을 사용하여 각 열의 NA 값 계산

다음 코드는 R base sapply() 함수를 사용하여 각 열의 NA 값 수를 계산하는 방법을 보여줍니다.

 #count NA values in each column
sapply(df, function (x) sum(is. na (x)))

    team points assists rebounds 
       0 1 2 0

결과에서 우리는 다음을 볼 수 있습니다:

  • 열에는 NA 값이 0개 있습니다.
  • 포인트 열에는 1개의 NA 값이 있습니다.
  • 어시스트 열에는 2개의 NA 값이 있습니다.
  • 반송 열에는 NA 값이 0개 있습니다.

참고 : sapply() 함수를 사용하면 데이터 프레임의 각 열에 함수를 적용할 수 있습니다. 이 예에서는 NA와 동일한 요소의 총 개수를 계산하는 함수를 적용합니다.

예시 2: dplyr을 사용하여 각 열의 NA 값 계산

다음 코드는 dplyr 패키지의 summarise() 함수를 사용하여 각 열의 NA 값 수를 계산하는 방법을 보여줍니다.

 #count NA values in each column
sapply(df, function (x) sum(is. na (x)))

    team points assists rebounds 
       0 1 2 0

결과에서 우리는 다음을 볼 수 있습니다:

  • 열에는 NA 값이 0개 있습니다.
  • 포인트 열에는 1개의 NA 값이 있습니다.
  • 어시스트 열에는 2개의 NA 값이 있습니다.
  • 반송 열에는 NA 값이 0개 있습니다.

이 결과는 이전 예의 결과와 일치합니다.

참고 : dplyr 방법은 매우 큰 데이터 프레임으로 작업할 때 기본 R 방법보다 빠른 경향이 있습니다.

추가 리소스

다음 튜토리얼에서는 R에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

R에서 na.omit을 사용하는 방법
R에서 Complete.cases를 사용하는 방법
R의 데이터 프레임에서 빈 줄을 제거하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다