R에서 숫자 열만 크기를 조정하는 방법(예제 포함)
dplyr 패키지의 다음 구문을 사용하여 R에서 데이터 프레임의 숫자 열만 크기를 조정할 수 있습니다.
library (dplyr) df %>% mutate(across(where(is. numeric ), scale))
다음 예에서는 이 기능을 실제로 사용하는 방법을 보여줍니다.
예: dplyr을 사용하여 숫자 열만 크기 조정
다양한 농구 선수에 대한 정보를 포함하는 다음과 같은 데이터 프레임이 R에 있다고 가정합니다.
#create data frame df <- data. frame (team=c('A', 'B', 'C', 'D', 'E'), dots=c(22, 34, 30, 12, 18), assists=c(7, 9, 9, 12, 14), rebounds=c(5, 10, 10, 8, 8)) #view data frame df team points assists rebounds 1 to 22 7 5 2 B 34 9 10 3 C 30 9 10 4 D 12 12 8 5 E 18 14 8
R의 scale 함수를 사용하여 데이터 프레임의 숫자 열만 크기를 조정한다고 가정해 보겠습니다.
이를 위해 다음 구문을 사용할 수 있습니다.
library (dplyr)
#scale only the numeric columns in the data frame
df %>% mutate(across(where(is. numeric ), scale))
team points assists rebounds
1 A -0.1348400 -1.153200 -1.56144012
2 B 1.2135598 -0.432450 0.87831007
3 C 0.7640932 -0.432450 0.87831007
4 D -1.2585064 0.648675 -0.09759001
5 E -0.5843065 1.369425 -0.09759001
3개의 숫자 열( 포인트 , 어시스트 , 리바운드 )의 값은 조정되었으며 팀 열은 변경되지 않았습니다.
기술 노트
R의 scale() 함수는 다음과 같은 기본 구문을 사용합니다.
scale(x, center = TRUE , scale = TRUE )
금:
- x : 크기를 조정할 객체의 이름
- center : scale시 평균을 뺄지 여부. 기본값은 TRUE입니다.
- scale : 스케일링 시 표준편차로 나눌지 여부입니다. 기본값은 TRUE입니다.
이 함수는 다음 공식을 사용하여 조정된 값을 계산합니다.
스케일링된 x = ( 원래 x – x̄) / s
금:
- 원래 x : 원래 x 값
- x̄ : 표본의 의미
- s : 표본의 표준편차
이는 단순히 각 원래 값을 z-점수 로 변환하는 데이터 정규화 라고도 합니다.
추가 리소스
다음 튜토리얼에서는 dplyr을 사용하여 다른 일반적인 작업을 수행하는 방법을 설명합니다.
dplyr을 사용하여 이름으로 열을 선택하는 방법
dplyr을 사용하여 인덱스로 열을 선택하는 방법
dplyr에서 여러 조건으로 select_if를 사용하는 방법