R의 열에서 고유한 값을 계산하는 방법
다음 방법을 사용하여 R의 데이터 프레임 열에 있는 고유 값의 수를 계산할 수 있습니다.
방법 1: 기본 R 사용
length(unique(df$my_column))
방법 2: dplyr 사용
library (dplyr)
n_distinct(df$my_column)
다음 예에서는 다음 데이터 프레임을 사용하여 실제로 각 메서드를 사용하는 방법을 보여줍니다.
#create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'C', 'C', 'D'),
points=c(10, 13, 14, 14, 18, 19, 20, 20, 22))
#view data frame
df
team points
1 to 10
2 to 13
3 to 14
4 to 14
5 B 18
6 B 19
7 C 20
8 C 20
9 D 22
방법 1: R base를 사용하여 열의 고유 값 계산
다음 코드는 R 기본 함수를 사용하여 데이터 프레임의 포인트 열에 있는 고유 값의 개수를 계산하는 방법을 보여줍니다.
#count unique values in points column
length(unique(df$points))
[1] 7
포인트 열에는 7개의 고유 값이 있습니다.
데이터 프레임의 각 열에 있는 고유 값의 수를 계산하려면 sapply() 함수를 사용할 수 있습니다.
#count unique values in each column
sapply(df, function (x) length(unique(x)))
team points
4 7
결과에서 우리는 다음을 볼 수 있습니다:
- 포인트 열에는 7개의 고유 값이 있습니다.
- 팀 열에는 4개의 고유 값이 있습니다.
방법 2: dplyr을 사용하여 열의 고유 값 계산
다음 코드는 dplyr 패키지의 n_distinct() 함수를 사용하여 포인트 열의 고유 값 수를 계산하는 방법을 보여줍니다.
library (dplyr)
#count unique values in points column
n_distinct(df$points)
[1] 7
포인트 열에는 7개의 고유 값이 있습니다.
데이터 프레임의 각 열에 있는 고유 값의 수를 계산하려면 sapply() 함수를 사용할 수 있습니다.
library (dplyr)
#count unique values in each column
sapply(df, function (x) n_distinct(x))
team points
4 7
결과에서 우리는 다음을 볼 수 있습니다:
- 포인트 열에는 7개의 고유 값이 있습니다.
- 팀 열에는 4개의 고유 값이 있습니다.
이 결과는 기본 R 방법의 결과와 일치합니다.
추가 리소스
다음 튜토리얼에서는 R에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.
R에서 중복을 계산하는 방법
R에서 그룹별로 고유한 값을 계산하는 방법
R의 각 열에 있는 NA 값의 개수를 계산하는 방법