모델의 예측 정확도를 측정하는 데 가장 일반적으로 사용되는 측정항목 중 하나는 평균 절대 백분율 오차를 나타내는 MAPE 입니다. MAPE를 계산하는 공식은 다음과 같습니다. MAPE = (1/n) * Σ(|실제 – 예측| / |실제|) * 100 금: Σ – “합계”를 의미하는 화려한 기호...
원형 차트는 “파이”를 사용하여 데이터의 상대적 크기를 표시하는 원형 차트입니다. 이 튜토리얼에서는 Stata에서 원형 차트를 만들고 편집하는 방법을 설명합니다. Stata에서 원형 차트를 만드는 방법 Stata에서 원형 차트를 생성하고 편집하는 방법을 설명하기 위해 인구 조사 라는 데이터 세트를 사용하겠습니다. 먼저 명령 상자에...
QQ 플롯 (“분위수-분위수”)은 회귀 분석의 잔차가 정규 분포를 따르는지 여부를 평가하는 데 자주 사용됩니다. 이 튜토리얼에서는 Stata에서 QQ 플롯을 생성하고 해석하는 방법을 설명합니다. 예: Stata의 QQ 플롯 이 예에서는 Stata에 내장된 자동 데이터 세트를 사용합니다. 설명 변수로 mpg 와 변위 를...
로지스틱 회귀는 응답 변수가 이진일 때 회귀 모델을 맞추는 데 사용하는 통계 방법입니다. 로지스틱 회귀 모델이 데이터 세트에 얼마나 잘 맞는지 평가하기 위해 다음 두 가지 측정항목을 살펴볼 수 있습니다. 민감도: 결과가 실제로 긍정적일 때 모델이 관찰에 대한 긍정적인 결과를 예측할...
일원 분산 분석은 설명 변수의 수준이 다르면 특정 반응 변수에서 통계적으로 다른 결과가 나오는지 여부를 확인하는 데 사용됩니다. 예를 들어, 세 가지 교육 수준(준학사 학위, 학사 학위, 석사 학위)이 통계적으로 다른 연간 수입으로 이어지는지 여부를 이해하는 데 관심이 있을 수 있습니다....
선형 회귀 는 하나 이상의 설명 변수와 응답 변수 간의 관계를 이해하는 데 사용할 수 있는 방법입니다. 일반적으로 선형 회귀 분석을 수행할 때 설명 변수의 값을 기반으로 응답 변수의 평균 값을 추정하려고 합니다. 하지만 그 대신 우리는 중앙값, 0.25 백분위수, 0.90...
많은 통계 테스트에서는 테스트 결과를 신뢰할 수 있으려면 하나 이상의 변수가 정규 분포를 거쳐야 합니다. 이 튜토리얼에서는 Stata에서 변수 간의 정규성을 테스트하는 데 사용할 수 있는 몇 가지 방법을 설명합니다. 이러한 각 방법에 대해 auto 라는 내장 Stata 데이터 세트를 사용합니다....
회귀분석에서 다중공선성은 두 개 이상의 설명변수가 서로 높은 상관관계를 갖고 있어서 회귀모델에서 고유하거나 독립적인 정보를 제공하지 않는 경우에 발생합니다. 변수 간의 상관 정도가 충분히 높으면 회귀 모델을 피팅하고 해석할 때 문제가 발생할 수 있습니다. 예를 들어 다음 변수를 사용하여 다중 선형...
Mann-Whitney U 검정 (Wilcoxon 순위 합계 검정이라고도 함)은 표본 분포가 정규 분포를 따르지 않고 표본 크기가 작을 때(n < 30) 두 표본 간의 차이를 비교하는 데 사용됩니다. 이는 2-표본 t 검정 과 동등한 비모수적 t 검정으로 간주됩니다. 이 자습서에서는 Excel에서 Mann-Whitney...
회귀분석에서 다중공선성은 두 개 이상의 설명변수가 서로 높은 상관관계를 갖고 있어서 회귀모델에서 고유하거나 독립적인 정보를 제공하지 않는 경우에 발생합니다. 변수 간의 상관 정도가 충분히 높으면 회귀 모델을 피팅하고 해석할 때 문제가 발생할 수 있습니다. 다행스럽게도 회귀 모델에서 설명 변수 간의 상관...