[카테고리:] 가이드

랜덤 포레스트에 대한 간단한 소개

일련의 예측 변수와 반응 변수 사이의 관계가 매우 복잡한 경우, 우리는 종종 비선형 방법을 사용하여 이들 사이의 관계를 모델링합니다. 그러한 방법 중 하나는 예측 변수 세트를 사용하여 반응 변수의 값을 예측하는 의사 결정 트리를 생성하는 분류 및 회귀 트리 (종종 CART로...

R에서 랜덤 포레스트를 생성하는 방법(단계별)

일련의 예측 변수와 반응 변수 사이의 관계가 매우 복잡한 경우, 우리는 종종 비선형 방법을 사용하여 이들 사이의 관계를 모델링합니다. 그러한 방법 중 하나는 의사결정 트리를 구축하는 것입니다. 그러나 단일 의사결정 트리를 사용할 때의 단점은 높은 분산 으로 인해 어려움을 겪는 경향이...

Excel에서 샘플링 분포를 계산하는 방법

표본분포는 단일 모집단 의 많은 무작위 표본을 기반으로 한 특정 통계 의 확률 분포입니다. 이 튜토리얼에서는 Excel에서 샘플링 분포를 사용하여 다음을 수행하는 방법을 설명합니다. 표본분포를 생성합니다. 샘플링 분포를 시각화합니다. 표본분포의 평균과 표준편차를 계산합니다. 표본분포에 관한 확률을 계산합니다. Excel에서 샘플링 분포 생성...

Excel에서 무작위 표본을 선택하는 방법(단계별)

Excel의 데이터 세트에서 무작위 샘플을 선택하려는 경우가 종종 있습니다. 다행히도 0과 1 사이의 난수를 생성하는 RAND() 함수를 사용하면 쉽게 이 작업을 수행할 수 있습니다. 이 튜토리얼에서는 이 기능을 사용하여 Excel에서 무작위 샘플을 선택하는 방법에 대한 단계별 예를 제공합니다. 1단계: 데이터세트 만들기...

규모 및 위치 도표를 해석하는 방법: 예 포함

축척 위치 차트는 x축을 따라 회귀 모델 의 적합값을 표시하고 y축을 따라 표준화 잔차의 제곱근을 표시하는 차트 유형입니다. 이 그래프를 보면 다음 두 가지를 확인할 수 있습니다. 1. 빨간색 선이 플롯에서 대략 수평인지 확인합니다. 이 경우, 주어진 회귀 모델에 대해 등분산성...

R에서 신뢰 구간을 찾는 방법(예제 포함)

신뢰구간은 일정 수준의 신뢰도를 갖는 모집단 매개변수가 포함될 가능성이 있는 값의 범위입니다. 이는 다음 일반 공식에 따라 계산됩니다. 신뢰 구간 = (점 추정치) +/- (임계값)* (표준 오차) 이 공식은 하한과 상한이 있는 구간을 생성하며, 여기에는 일정 수준의 신뢰도를 갖는 모집단 모수가...

R에서 원시 데이터를 수동으로 입력하는 방법

R은 데이터 작업에 가장 널리 사용되는 프로그래밍 언어 중 하나입니다. 하지만 데이터 작업을 하기 전에 실제로 데이터를 R로 가져와야 합니다! 데이터가 이미 CSV 또는 Excel 파일에 있는 경우 다음 튜토리얼의 단계에 따라 이를 R로 가져올 수 있습니다. CSV 파일을 R로 가져오는...

정규분포와 t분포: 차이점은 무엇인가요?

정규분포 는 모든 통계에서 가장 일반적으로 사용되는 분포로 대칭적이고 종 모양의 분포로 알려져 있다. 밀접하게 관련된 분포는 대칭이고 종 모양이지만 정규 분포보다 “꼬리”가 더 무거운 t 분포 입니다. 즉, 정규분포에 비해 분포의 값이 중앙보다 양끝에 더 많이 위치합니다. 통계 전문 용어로...

머신러닝 강화에 대한 간단한 소개

대부분 의 지도 기계 학습 알고리즘은 선형 회귀 , 로지스틱 회귀 , 능선 회귀 등과 같은 단일 예측 모델 사용을 기반으로 합니다. 그러나 배깅 및 랜덤 포레스트 와 같은 방법은 원본 데이터세트의 반복적인 부트스트랩 샘플을 기반으로 다양한 모델을 구축합니다. 새로운 데이터에...

인구 대 샘플: 차이점이 무엇인가요?

통계에서 우리는 특정 연구 질문에 답하기 위해 데이터를 수집하려는 경우가 많습니다. 예를 들어, 다음 질문에 답하고 싶을 수 있습니다. 1. 플로리다주 마이애미의 평균 가계 소득은 얼마입니까? 2. 특정 거북이 개체군의 평균 체중은 얼마입니까? 3. 특정 카운티의 주민 중 몇 퍼센트가 특정...