R의 열에서 고유한 값을 계산하는 방법


다음 방법을 사용하여 R의 데이터 프레임 열에 있는 고유 값의 수를 계산할 수 있습니다.

방법 1: 기본 R 사용

 length(unique(df$my_column))

방법 2: dplyr 사용

 library (dplyr)

n_distinct(df$my_column)

다음 예에서는 다음 데이터 프레임을 사용하여 실제로 각 메서드를 사용하는 방법을 보여줍니다.

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'C', 'C', 'D'),
                 points=c(10, 13, 14, 14, 18, 19, 20, 20, 22))

#view data frame
df

  team points
1 to 10
2 to 13
3 to 14
4 to 14
5 B 18
6 B 19
7 C 20
8 C 20
9 D 22

방법 1: R base를 사용하여 열의 고유 값 계산

다음 코드는 R 기본 함수를 사용하여 데이터 프레임의 포인트 열에 있는 고유 값의 개수를 계산하는 방법을 보여줍니다.

 #count unique values in points column
length(unique(df$points))

[1] 7

포인트 열에는 7개의 고유 값이 있습니다.

데이터 프레임의 각 열에 있는 고유 값의 수를 계산하려면 sapply() 함수를 사용할 수 있습니다.

 #count unique values in each column
sapply(df, function (x) length(unique(x)))

  team points 
     4 7

결과에서 우리는 다음을 볼 수 있습니다:

  • 포인트 열에는 7개의 고유 값이 있습니다.
  • 열에는 4개의 고유 값이 있습니다.

방법 2: dplyr을 사용하여 열의 고유 값 계산

다음 코드는 dplyr 패키지의 n_distinct() 함수를 사용하여 포인트 열의 고유 값 수를 계산하는 방법을 보여줍니다.

 library (dplyr)

#count unique values in points column
n_distinct(df$points)

[1] 7

포인트 열에는 7개의 고유 값이 있습니다.

데이터 프레임의 각 열에 있는 고유 값의 수를 계산하려면 sapply() 함수를 사용할 수 있습니다.

 library (dplyr)

#count unique values in each column
sapply(df, function (x) n_distinct(x))

  team points 
     4 7

결과에서 우리는 다음을 볼 수 있습니다:

  • 포인트 열에는 7개의 고유 값이 있습니다.
  • 열에는 4개의 고유 값이 있습니다.

이 결과는 기본 R 방법의 결과와 일치합니다.

추가 리소스

다음 튜토리얼에서는 R에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

R에서 중복을 계산하는 방법
R에서 그룹별로 고유한 값을 계산하는 방법
R의 각 열에 있는 NA 값의 개수를 계산하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다