중심극한정리: 충족되어야 할 네 가지 조건
중심 극한 정리 는 모집단 분포가 정규 분포가 아니더라도 표본 크기가 충분히 크면 표본 평균의 표본 분포가 대략 정규 분포를 따른다는 것 입니다.
중심 극한 정리를 적용하려면 다음 네 가지 조건을 충족해야 합니다.
1. 무작위화 : 모집단의 각 구성원이 표본의 일부로 선택될 확률이 동일하도록 데이터를 무작위로 샘플링해야 합니다.
2. 독립성: 표본의 값은 서로 독립적이어야 합니다.
3. 10% 조건: 표본을 복원 없이 추출할 때 표본 크기는 모집단의 10%를 초과해서는 안 됩니다.
4. 큰 표본 조건: 표본 크기는 충분히 커야 합니다.
이 튜토리얼에서는 각 조건에 대한 간략한 설명을 제공합니다.
조건 1: 무작위화
중심 극한 정리를 적용하려면 우리가 사용하는 데이터는 확률 표본 추출 방법을 사용하여 모집단에서 무작위로 추출되어야 합니다.
통계에는 두 가지 유형의 샘플링 방법이 있습니다.
1. 확률 표본 추출 방법: 모집단의 각 구성원이 표본의 일부로 선택될 확률이 동일한 표본 추출 방법입니다. 예는 다음과 같습니다:
- 단순 무작위 표본
- 층화된 무작위 표본
- 군집화된 무작위 표본
- 체계적인 무작위 샘플링
2. 비확률 표본 추출 방법: 모집단의 각 구성원이 표본의 일부로 선택될 확률이 동일하지 않은 표본 추출 방법입니다. 예는 다음과 같습니다:
- 편의 샘플
- 자발적인 응답 샘플
- 눈덩이 샘플
- 순수 샘플
표본을 얻기 위해서는 확률표본법을 사용하는 것이 중요합니다. 이는 모집단의 대표 표본을 얻을 가능성을 최대화하기 때문입니다.
조건 2: 독립성
중심 극한 정리를 적용하려면 표본의 각 값이 서로 독립적이라고 가정해야 합니다. 즉, 한 사건의 발생은 다른 사건의 발생에 영향을 미치지 않습니다.
확률 표본 추출 방법을 사용하면 이러한 가정이 충족되는 경우가 많습니다. 이러한 유형의 표본 추출 방법은 서로 완전히 독립적으로 표본에 포함할 관측치를 선택하기 때문입니다.
조건 3: 10% 조건
표본을 대체 없이 추출하는 경우(거의 항상 그렇습니다) 표본 크기는 전체 모집단의 10%를 초과해서는 안 됩니다.
예를 들어:
- 인구 규모가 500명인 경우 표본 크기는 50명을 초과해서는 안 됩니다.
- 인구 규모가 1,000명이라면 표본이 100명을 초과해서는 안 됩니다.
- 인구 규모가 50,000명인 경우 표본 크기는 5,000명을 초과해서는 안 됩니다.
등등.
조건 4: 대규모 샘플 조건
마지막으로 중심 극한 정리를 적용하려면 표본 크기가 충분히 커야 합니다.
일반적으로 우리는 “충분히 큰 것”을 30개 이상으로 간주합니다. 그러나 이 숫자는 인구 분포의 기본 형태에 따라 약간 다를 수 있습니다.
특히:
- 모집단 분포가 대칭인 경우 15개 정도의 작은 표본 크기로도 충분할 수 있습니다.
- 인구 분포가 치우쳐 있는 경우 일반적으로 최소 30명의 표본이 필요합니다.
- 인구 분포가 극도로 치우친 경우 40명 이상의 표본이 필요할 수 있습니다.
모집단 분포의 모양에 따라 중심 극한 정리를 적용하려면 표본 크기가 30보다 크거나 작아야 할 수도 있습니다.