[카테고리:] 가이드

Dplyr: 열에 문자열이 포함된 경우 변수를 변경하는 방법

열에 특정 문자열이 포함된 경우 dplyr 에서 다음 기본 구문을 사용하여 변수를 변경할 수 있습니다. library (dplyr) df %>% mutate_at(vars(contains(' starter ')), ~ (scale(.) %>% as. vector )) 이 특정 구문은 열 이름에 “starter”라는 문자열이 포함된 데이터 프레임의 각 변수에 scale()...

Google 스프레드시트: 히스토그램의 저장소 수를 변경하는 방법

히스토그램은 데이터 세트의 값 분포를 빠르게 시각화하는 데 사용할 수 있는 플롯입니다. 이 튜토리얼에서는 Google 스프레드시트에서 히스토그램을 만들고 히스토그램이 원하는 대로 정확하게 표시되도록 상자 수를 변경하는 방법에 대한 단계별 예를 제공합니다. 1단계: 데이터 생성 먼저 다음 데이터세트를 만들어 보겠습니다. 2단계: 히스토그램...

Google 스프레드시트에서 절사 평균을 계산하는 방법

절사평균은 데이터 세트에서 가장 작은 값과 가장 큰 값의 특정 비율을 제거한 후 계산된 데이터 세트의 평균입니다. 예를 들어, 10% 절사 평균은 데이터 세트의 끝에서 값의 10%를 제거한 후 데이터 세트의 평균을 나타냅니다. Google 스프레드시트에서 절사 평균을 계산하려면 다음 기본 구문을...

Excel에서 절사 평균을 계산하는 방법

절사평균은 데이터 세트에서 가장 작은 값과 가장 큰 값의 특정 비율을 제거한 후 계산된 데이터 세트의 평균입니다. 예를 들어, 10% 절사 평균은 데이터 세트 끝에서 상위 10% 값을 제거한 후 데이터 세트의 평균을 나타냅니다. Excel에서 절사 평균을 계산하려면 다음 기본 구문을...

Data.table과 r의 데이터 프레임: 세 가지 주요 차이점

R 프로그래밍 언어에서 data.frame은 R 데이터베이스의 일부입니다. data.table 패키지의 setDF 함수를 사용하여 모든 data.frame을 data.table 로 변환할 수 있습니다. data.table은 R의 data.frame에 비해 다음과 같은 장점을 제공합니다. 1. data.table 패키지의 fread 함수를 사용하면 파일을 data.frame으로 읽는 read.csv 와 같은 기본 R...

R에서 같은 줄에 문자열과 변수를 인쇄하는 방법

종종 R에서 같은 줄에 문자열과 변수를 인쇄하고 싶을 수도 있습니다. 다행히도 print() 및 Paste0() 함수를 사용하면 이 작업을 쉽게 수행할 수 있습니다. 다음 예에서는 이를 수행하는 방법을 보여줍니다. 예: R의 같은 줄에 문자열과 변수 인쇄 다음 코드는 R에서 같은 줄에 문자열과...

R에서 elbow 방법을 사용하여 최적의 클러스터를 찾는 방법

기계 학습 에서 가장 일반적으로 사용되는 클러스터링 알고리즘 중 하나는 k-평균 클러스터링 으로 알려져 있습니다. K-평균 클러스터링은 데이터 세트의 각 관측치를 K 클러스터 중 하나에 배치하는 기술입니다. 최종 목표는 각 클러스터 내의 관측치가 서로 매우 유사한 반면 다른 클러스터의 관측치는 서로...

Google 스프레드시트에서 로지스틱 회귀를 수행하는 방법

로지스틱 회귀는 응답 변수가 이진일 때 회귀 모델을 맞추는 데 사용할 수 있는 방법입니다. 다음 단계별 예에서는 Google Sheets에서 로지스틱 회귀를 수행하는 방법을 보여줍니다. 1단계: XLMiner 분석 도구 설치 Google Sheets에서 로지스틱 회귀를 수행하려면 먼저 무료 XLMiner Analysis Toolpak을 설치해야 합니다....