통계에서 정규성 가정은 무엇입니까?


많은 통계 테스트는 정규성 가정 이라는 것에 의존합니다.

이 가설은 모집단에서 많은 독립적인 무작위 표본을 수집하고 관심 있는 값(예: 표본 평균 )을 계산한 다음 표본 평균의 분포를 시각화하기 위해 히스토그램을 생성하면 완벽한 종형 곡선을 관찰해야 한다는 것입니다.

다음을 포함하여 많은 통계 기법이 데이터에 대해 이러한 가정을 합니다.

1. 일표본 t 검정 : 표본 데이터가 정규 분포를 따르는 것으로 가정합니다.

2. 2-표본 t-검정 : 두 표본이 정규 분포를 따르는 것으로 가정합니다.

3. ANOVA : 모델 잔차가 정규분포를 따른다고 가정합니다.

4. 선형 회귀 : 모델 잔차가 정규 분포를 따르는 것으로 가정합니다.

이 가정이 충족되지 않으면 이러한 테스트 결과를 신뢰할 수 없게 되며 데이터 샘플에서 도출된 결론을 전체 모집단 에 대해 자신있게 일반화할 수 없습니다. 그렇기 때문에 이 가설이 충족되는지 확인하는 것이 중요합니다.

이 정규성 가정이 충족되는지 확인하는 두 가지 일반적인 방법이 있습니다.

1. 정규성을 시각화

2. 공식 통계 테스트 수행

다음 섹션에서는 만들 수 있는 특정 그래프와 정규성을 확인하기 위해 수행할 수 있는 특정 통계 테스트에 대해 설명합니다.

정규성을 시각화

데이터 세트가 정규 분포를 이루고 있는지 확인하는 빠르고 비공식적인 방법은 히스토그램이나 QQ 플롯을 만드는 것입니다.

1. 히스토그램

데이터 세트의 히스토그램이 대략 종 모양이라면 데이터가 정규 분포를 따르고 있을 가능성이 높습니다.

2. 큐큐랜드

“분위수-분위수”의 약자인 QQ 플롯은 x축을 따라 이론적 분위수(즉, 정규 분포를 따른 경우 데이터가 있을 위치)를 표시하고 y축을 따라 샘플의 분위수를 표시하는 플롯 유형입니다. (즉, 귀하의 데이터가 실제로 상주하는 곳).

데이터 값이 45도 각도를 이루는 대략적인 직선을 따르는 경우 데이터는 정규 분포를 따르는 것으로 간주됩니다.

공식적인 통계 테스트 수행

공식적인 통계 검정을 수행하여 데이터 세트가 정규 분포를 따르는지 확인할 수도 있습니다.

검정의 p-값이 특정 유의 수준(예: α = 0.05)보다 낮으면 데이터가 정규 분포를 따르지 않는다고 말할 수 있는 충분한 증거가 있는 것입니다.

정규성을 테스트하는 데 일반적으로 사용되는 세 가지 통계 테스트가 있습니다.

1. Jarque-Bera 테스트

2. 샤피로-윌크 테스트

3. 콜모고로프-스미르노프 테스트

정규성 가정이 위반되면 어떻게 해야 할까요?

데이터가 정규 분포를 따르지 않는 것으로 확인되면 다음 두 가지 옵션이 있습니다.

1. 데이터를 변환합니다.

한 가지 옵션은 데이터를 보다 정규 분포로 만들기 위해 간단히 변환하는 것입니다. 일반적인 변환은 다음과 같습니다.

  • 로그 변환: 데이터를 y에서 log(y) 로 변환합니다.
  • 제곱근 변환: 데이터를 y에서 √y 로 변환
  • 세제곱근 변환: 데이터를 y에서 y 1/3 으로 변환
  • Box-Cox 변환: Box-Cox 프로시저를 사용하여 데이터 변환

이러한 변환을 수행하면 일반적으로 데이터 값의 분포가 보다 정규 분포를 띄게 됩니다.

2. 비모수적 테스트 수행

정규성을 가정하는 통계 테스트를 모수 테스트 라고 합니다. 그러나 이러한 정규성을 가정하지 않는 소위 비모수적 테스트 계열도 있습니다.

데이터가 정규 분포를 따르지 않는 것으로 밝혀지면 비모수적 테스트를 수행하면 됩니다. 다음은 일반적인 통계 테스트의 비모수적 버전입니다.

파라메트릭 테스트 비모수적 동등성
샘플 t 테스트 샘플 Wilcoxon 부호 순위 테스트
2-표본 t-검정 Mann-Whitney U 테스트
쌍을 이루는 표본 t-검정 Wilcoxon 부호 순위 테스트의 두 샘플
일원 분산 분석 크루스칼-월리스 테스트

이러한 각각의 비모수적 검정은 정규성 가정을 만족하지 않고도 통계적 검정을 수행하는 것을 가능하게 합니다.

추가 리소스

T 테스트에서 공식화된 네 가지 가설
선형 회귀의 네 가지 가정
ANOVA의 네 가지 가설

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다