R에서 별도의 함수를 사용하는 방법(예제 포함)


Tidyr 패키지의 Separate() 함수를 사용하면 데이터 프레임 열을 여러 열로 분리할 수 있습니다.

이 함수는 다음 기본 구문을 사용합니다.

분리됨(data, col, into, sep)

금:

  • data : 데이터 프레임의 이름
  • col : 구분할 컬럼의 이름
  • into : 분리할 열의 이름 벡터
  • sep : 열을 구분할 값

다음 예에서는 이 기능을 실제로 사용하는 방법을 보여줍니다.

예시 1: 열을 두 개의 열로 분할

R에 다음과 같은 데이터 프레임이 있다고 가정합니다.

 #create data frame
df <- data. frame (player=c('A', 'A', 'B', 'B', 'C', 'C'),
                 year=c(1, 2, 1, 2, 1, 2),
                 stats=c('22-2', '29-3', '18-6', '11-8', '12-5', '19-2'))

#view data frame
df

  player year stats
1 A 1 22-2
2 A 2 29-3
3 B 1 18-6
4 B 2 11-8
5 C 1 12-5
6 C 2 19-2

Separate() 함수를 사용하여 통계 열을 다음과 같이 “포인트”와 “어시스트”라는 두 개의 새로운 열로 분리할 수 있습니다.

 library (tidyr)

#separate stats column into points and assists columns
separate(df, col=stats, into=c(' points ', ' assists '), sep=' - ')

  player year points assists
1 A 1 22 2
2 A 2 29 3
3 B 1 18 6
4 B 2 11 8
5 C 1 12 5
6 C 2 19 2

예 2: 열을 3개 이상의 열로 분할

R에 다음과 같은 데이터 프레임이 있다고 가정합니다.

 #create data frame
df2 <- data. frame (player=c('A', 'A', 'B', 'B', 'C', 'C'),
                 year=c(1, 2, 1, 2, 1, 2),
                 stats=c('22/2/3', '29/3/4', '18/6/7', '11/1/2', '12/1/1', '19/2/4 '))

#view data frame
df2

  player year stats
1 A 1 22/2/3
2 A 2 29/3/4
3 B 1 18/6/7
4 B 2 11/1/2
5 C 1 12/1/1
6 C 2 19/2/4

Separate() 함수를 사용하여 통계 열을 세 개의 개별 열로 분리할 수 있습니다.

 library (tidyr)

#separate stats column into three new columns
separate(df, col=stats, into=c(' points ', ' assists ', ' steals '), sep=' / ')

  player year points assists steals
1 A 1 22 2 3
2 A 2 29 3 4
3 B 1 18 6 7
4 B 2 11 1 2
5 C 1 12 1 1
6 C 2 19 2 4

추가 리소스

Tidyr 패키지의 목표는 다음과 같은 특징을 가진 “정돈된” 데이터를 생성하는 것입니다.

  • 각 열은 변수입니다.
  • 각 줄은 관찰입니다.
  • 각 셀은 고유한 값입니다.

Tidyr 패키지는 네 가지 주요 기능을 사용하여 정렬된 데이터를 생성합니다.

1. Spread() 함수.

2. 수집() 함수.

3. Separate() 함수.

4. 단위() 함수.

이 네 가지 기능을 마스터하면 모든 데이터 프레임에서 “정리된” 데이터를 생성할 수 있습니다.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다