R에서 별도의 함수를 사용하는 방법(예제 포함)
Tidyr 패키지의 Separate() 함수를 사용하면 데이터 프레임 열을 여러 열로 분리할 수 있습니다.
이 함수는 다음 기본 구문을 사용합니다.
분리됨(data, col, into, sep)
금:
- data : 데이터 프레임의 이름
- col : 구분할 컬럼의 이름
- into : 분리할 열의 이름 벡터
- sep : 열을 구분할 값
다음 예에서는 이 기능을 실제로 사용하는 방법을 보여줍니다.
예시 1: 열을 두 개의 열로 분할
R에 다음과 같은 데이터 프레임이 있다고 가정합니다.
#create data frame df <- data. frame (player=c('A', 'A', 'B', 'B', 'C', 'C'), year=c(1, 2, 1, 2, 1, 2), stats=c('22-2', '29-3', '18-6', '11-8', '12-5', '19-2')) #view data frame df player year stats 1 A 1 22-2 2 A 2 29-3 3 B 1 18-6 4 B 2 11-8 5 C 1 12-5 6 C 2 19-2
Separate() 함수를 사용하여 통계 열을 다음과 같이 “포인트”와 “어시스트”라는 두 개의 새로운 열로 분리할 수 있습니다.
library (tidyr) #separate stats column into points and assists columns separate(df, col=stats, into=c(' points ', ' assists '), sep=' - ') player year points assists 1 A 1 22 2 2 A 2 29 3 3 B 1 18 6 4 B 2 11 8 5 C 1 12 5 6 C 2 19 2
예 2: 열을 3개 이상의 열로 분할
R에 다음과 같은 데이터 프레임이 있다고 가정합니다.
#create data frame df2 <- data. frame (player=c('A', 'A', 'B', 'B', 'C', 'C'), year=c(1, 2, 1, 2, 1, 2), stats=c('22/2/3', '29/3/4', '18/6/7', '11/1/2', '12/1/1', '19/2/4 ')) #view data frame df2 player year stats 1 A 1 22/2/3 2 A 2 29/3/4 3 B 1 18/6/7 4 B 2 11/1/2 5 C 1 12/1/1 6 C 2 19/2/4
Separate() 함수를 사용하여 통계 열을 세 개의 개별 열로 분리할 수 있습니다.
library (tidyr) #separate stats column into three new columns separate(df, col=stats, into=c(' points ', ' assists ', ' steals '), sep=' / ') player year points assists steals 1 A 1 22 2 3 2 A 2 29 3 4 3 B 1 18 6 7 4 B 2 11 1 2 5 C 1 12 1 1 6 C 2 19 2 4
추가 리소스
Tidyr 패키지의 목표는 다음과 같은 특징을 가진 “정돈된” 데이터를 생성하는 것입니다.
- 각 열은 변수입니다.
- 각 줄은 관찰입니다.
- 각 셀은 고유한 값입니다.
Tidyr 패키지는 네 가지 주요 기능을 사용하여 정렬된 데이터를 생성합니다.
1. Spread() 함수.
2. 수집() 함수.
3. Separate() 함수.
4. 단위() 함수.
이 네 가지 기능을 마스터하면 모든 데이터 프레임에서 “정리된” 데이터를 생성할 수 있습니다.