가이드 - Statorials

랜덤 포레스트에 대한 간단한 소개

에 의해 벤자민 앤더슨 7월 27, 2023 가이드 댓글 0개

일련의 예측 변수와 반응 변수 사이의 관계가 매우 복잡한 경우, 우리는 종종 비선형 방법을 사용하여 이들 사이의 관계를 모델링합니다. 그러한 방법 중 하나는 예측 변수 세트를 사용하여 반응 변수의 값을 예측하는 의사 결정 트리를 생성하는 분류 및 회귀 트리 (종종 CART로...

[계속 읽으세요...]

R에서 랜덤 포레스트를 생성하는 방법(단계별)

에 의해 벤자민 앤더슨 7월 27, 2023 가이드 댓글 0개

일련의 예측 변수와 반응 변수 사이의 관계가 매우 복잡한 경우, 우리는 종종 비선형 방법을 사용하여 이들 사이의 관계를 모델링합니다. 그러한 방법 중 하나는 의사결정 트리를 구축하는 것입니다. 그러나 단일 의사결정 트리를 사용할 때의 단점은 높은 분산 으로 인해 어려움을 겪는 경향이...

[계속 읽으세요...]

Excel에서 샘플링 분포를 계산하는 방법

에 의해 벤자민 앤더슨 7월 27, 2023 가이드 댓글 0개

표본분포는 단일 모집단 의 많은 무작위 표본을 기반으로 한 특정 통계 의 확률 분포입니다. 이 튜토리얼에서는 Excel에서 샘플링 분포를 사용하여 다음을 수행하는 방법을 설명합니다. 표본분포를 생성합니다. 샘플링 분포를 시각화합니다. 표본분포의 평균과 표준편차를 계산합니다. 표본분포에 관한 확률을 계산합니다. Excel에서 샘플링 분포 생성...

[계속 읽으세요...]

Excel에서 무작위 표본을 선택하는 방법(단계별)

에 의해 벤자민 앤더슨 7월 27, 2023 가이드 댓글 0개

Excel의 데이터 세트에서 무작위 샘플을 선택하려는 경우가 종종 있습니다. 다행히도 0과 1 사이의 난수를 생성하는 RAND() 함수를 사용하면 쉽게 이 작업을 수행할 수 있습니다. 이 튜토리얼에서는 이 기능을 사용하여 Excel에서 무작위 샘플을 선택하는 방법에 대한 단계별 예를 제공합니다. 1단계: 데이터세트 만들기...

[계속 읽으세요...]

규모 및 위치 도표를 해석하는 방법: 예 포함

에 의해 벤자민 앤더슨 7월 27, 2023 가이드 댓글 0개

축척 위치 차트는 x축을 따라 회귀 모델 의 적합값을 표시하고 y축을 따라 표준화 잔차의 제곱근을 표시하는 차트 유형입니다. 이 그래프를 보면 다음 두 가지를 확인할 수 있습니다. 1. 빨간색 선이 플롯에서 대략 수평인지 확인합니다. 이 경우, 주어진 회귀 모델에 대해 등분산성...

[계속 읽으세요...]

R에서 신뢰 구간을 찾는 방법(예제 포함)

에 의해 벤자민 앤더슨 7월 27, 2023 가이드 댓글 0개

신뢰구간은 일정 수준의 신뢰도를 갖는 모집단 매개변수가 포함될 가능성이 있는 값의 범위입니다. 이는 다음 일반 공식에 따라 계산됩니다. 신뢰 구간 = (점 추정치) +/- (임계값)* (표준 오차) 이 공식은 하한과 상한이 있는 구간을 생성하며, 여기에는 일정 수준의 신뢰도를 갖는 모집단 모수가...

[계속 읽으세요...]

R에서 원시 데이터를 수동으로 입력하는 방법

에 의해 벤자민 앤더슨 7월 27, 2023 가이드 댓글 0개

R은 데이터 작업에 가장 널리 사용되는 프로그래밍 언어 중 하나입니다. 하지만 데이터 작업을 하기 전에 실제로 데이터를 R로 가져와야 합니다! 데이터가 이미 CSV 또는 Excel 파일에 있는 경우 다음 튜토리얼의 단계에 따라 이를 R로 가져올 수 있습니다. CSV 파일을 R로 가져오는...

[계속 읽으세요...]

정규분포와 t분포: 차이점은 무엇인가요?

에 의해 벤자민 앤더슨 7월 27, 2023 가이드 댓글 0개

정규분포 는 모든 통계에서 가장 일반적으로 사용되는 분포로 대칭적이고 종 모양의 분포로 알려져 있다. 밀접하게 관련된 분포는 대칭이고 종 모양이지만 정규 분포보다 “꼬리”가 더 무거운 t 분포 입니다. 즉, 정규분포에 비해 분포의 값이 중앙보다 양끝에 더 많이 위치합니다. 통계 전문 용어로...

[계속 읽으세요...]

머신러닝 강화에 대한 간단한 소개

에 의해 벤자민 앤더슨 7월 27, 2023 가이드 댓글 0개

대부분 의 지도 기계 학습 알고리즘은 선형 회귀 , 로지스틱 회귀 , 능선 회귀 등과 같은 단일 예측 모델 사용을 기반으로 합니다. 그러나 배깅 및 랜덤 포레스트 와 같은 방법은 원본 데이터세트의 반복적인 부트스트랩 샘플을 기반으로 다양한 모델을 구축합니다. 새로운 데이터에...

[계속 읽으세요...]

인구 대 샘플: 차이점이 무엇인가요?

에 의해 벤자민 앤더슨 7월 27, 2023 가이드 댓글 0개

통계에서 우리는 특정 연구 질문에 답하기 위해 데이터를 수집하려는 경우가 많습니다. 예를 들어, 다음 질문에 답하고 싶을 수 있습니다. 1. 플로리다주 마이애미의 평균 가계 소득은 얼마입니까? 2. 특정 거북이 개체군의 평균 체중은 얼마입니까? 3. 특정 카운티의 주민 중 몇 퍼센트가 특정...

[계속 읽으세요...]

[카테고리:] 가이드