열에 특정 문자열이 포함된 경우 dplyr 에서 다음 기본 구문을 사용하여 변수를 변경할 수 있습니다. library (dplyr) df %>% mutate_at(vars(contains(' starter ')), ~ (scale(.) %>% as. vector )) 이 특정 구문은 열 이름에 “starter”라는 문자열이 포함된 데이터 프레임의 각 변수에 scale()...
히스토그램은 데이터 세트의 값 분포를 빠르게 시각화하는 데 사용할 수 있는 플롯입니다. 이 튜토리얼에서는 Google 스프레드시트에서 히스토그램을 만들고 히스토그램이 원하는 대로 정확하게 표시되도록 상자 수를 변경하는 방법에 대한 단계별 예를 제공합니다. 1단계: 데이터 생성 먼저 다음 데이터세트를 만들어 보겠습니다. 2단계: 히스토그램...
절사평균은 데이터 세트에서 가장 작은 값과 가장 큰 값의 특정 비율을 제거한 후 계산된 데이터 세트의 평균입니다. 예를 들어, 10% 절사 평균은 데이터 세트의 끝에서 값의 10%를 제거한 후 데이터 세트의 평균을 나타냅니다. Google 스프레드시트에서 절사 평균을 계산하려면 다음 기본 구문을...
절사평균은 데이터 세트에서 가장 작은 값과 가장 큰 값의 특정 비율을 제거한 후 계산된 데이터 세트의 평균입니다. 예를 들어, 10% 절사 평균은 데이터 세트 끝에서 상위 10% 값을 제거한 후 데이터 세트의 평균을 나타냅니다. Excel에서 절사 평균을 계산하려면 다음 기본 구문을...
R 프로그래밍 언어에서 data.frame은 R 데이터베이스의 일부입니다. data.table 패키지의 setDF 함수를 사용하여 모든 data.frame을 data.table 로 변환할 수 있습니다. data.table은 R의 data.frame에 비해 다음과 같은 장점을 제공합니다. 1. data.table 패키지의 fread 함수를 사용하면 파일을 data.frame으로 읽는 read.csv 와 같은 기본 R...
종종 R에서 같은 줄에 문자열과 변수를 인쇄하고 싶을 수도 있습니다. 다행히도 print() 및 Paste0() 함수를 사용하면 이 작업을 쉽게 수행할 수 있습니다. 다음 예에서는 이를 수행하는 방법을 보여줍니다. 예: R의 같은 줄에 문자열과 변수 인쇄 다음 코드는 R에서 같은 줄에 문자열과...
기계 학습 에서 가장 일반적으로 사용되는 클러스터링 알고리즘 중 하나는 k-평균 클러스터링 으로 알려져 있습니다. K-평균 클러스터링은 데이터 세트의 각 관측치를 K 클러스터 중 하나에 배치하는 기술입니다. 최종 목표는 각 클러스터 내의 관측치가 서로 매우 유사한 반면 다른 클러스터의 관측치는 서로...
로지스틱 회귀는 응답 변수가 이진일 때 회귀 모델을 맞추는 데 사용할 수 있는 방법입니다. 다음 단계별 예에서는 Google Sheets에서 로지스틱 회귀를 수행하는 방법을 보여줍니다. 1단계: XLMiner 분석 도구 설치 Google Sheets에서 로지스틱 회귀를 수행하려면 먼저 무료 XLMiner Analysis Toolpak을 설치해야 합니다....
다음 수식을 사용하여 Google 스프레드시트의 기간 범위를 합산할 수 있습니다. = ARRAYFORMULA ( TEXT ( SUM ( IFERROR ( TIMEVALUE ( C2:C8 ) ) ) , " [h]:mm:ss " ) ) 이 특정 수식은 C2:C8 범위의 모든 기간을 합산하고 결과를 시,...