중심 극한 정리: 정의 + 예


중심 극한 정리모집단 분포가 정규 분포가 아니더라도 표본 크기가 충분히 크면 표본 평균의 표본 분포가 대략 정규 분포를 따른다는 것 입니다.

중심 극한 정리는 또한 샘플링 분포가 다음과 같은 속성을 갖는다고 명시합니다.

1. 표본분포의 평균은 모집단 분포의 평균과 같습니다.

x = μ

2. 표본분포의 분산은 모집단 분포의 분산을 표본 크기로 나눈 값과 같습니다.

s2 = σ2 /n

중심 극한 정리의 예

다음은 실제로 중심 극한 정리를 설명하는 몇 가지 예입니다.

균등 분포

거북이 등껍질의 너비가 최소 너비가 2인치, 최대 너비가 6인치인 균일한 분포를 따른다고 가정합니다. 즉, 거북이를 무작위로 선택하고 등껍질의 너비를 측정하면 너비 도 2~6인치일 가능성이 높습니다.

거북이 등껍질 너비의 분포를 나타내기 위해 히스토그램을 만들면 다음과 같습니다.

중심 극한 정리의 균일 분포 예
균일 분포의 평균은 μ = (b+a) / 2입니다. 여기서 b 는 가능한 가장 큰 값이고 a 는 가능한 가장 작은 값입니다. 이 경우에는 (6+2) / 2 = 4입니다.

균일분포의 분산은 σ2 = (ba) 2/12 입니다. 이 경우 (6-2) 2/12 = 1.33 이다.

균일분포에서 2개의 무작위 표본 추출

이제 이 모집단에서 거북이 2마리를 무작위로 추출하여 각 거북이 등껍질의 너비를 측정한다고 상상해 보세요. 첫 번째 거북이 등껍질의 너비가 3인치이고 두 번째 거북이 등껍질의 너비가 6인치라고 가정해 보겠습니다. 이 거북이 2마리 샘플의 평균 너비는 4.5인치입니다.

다음으로, 이 모집단에서 거북이 2마리의 무작위 표본을 추출하고 각 거북이의 등껍질 너비를 다시 측정한다고 상상해 보세요. 첫 번째 거북이 등껍질의 너비가 2.5인치이고 두 번째 거북이 등껍질의 너비도 2.5인치라고 가정해 보겠습니다. 이 거북이 2마리 샘플의 평균 너비는 2.5인치입니다.

거북이 2마리로부터 계속해서 무작위 샘플을 채취하고 매번 평균 등딱지 너비를 계속 찾는다고 상상해 보세요.

거북이 2마리에서 채취한 모든 샘플의 평균 등딱지 너비를 나타내기 위해 히스토그램을 만든 경우 다음과 같습니다.

균일 분포에 대한 표본 크기 2의 중심 극한 정리
이는 표본 평균의 분포를 보여주기 때문에 표본 평균에 대한 표본 분포 라고 합니다.

이 표본분포의 평균은 x = μ = 4 입니다.

이 표본분포의 분산은 s2 = σ2 / n = 1.33 / 2 = 0.665 입니다.

균일분포에서 5개의 무작위 표본 추출

이제 동일한 실험을 반복한다고 가정해 보겠습니다. 이번에는 거북이 5마리로부터 무작위 샘플을 계속해서 채취하여 매번 평균 등딱지 너비를 찾습니다.

5마리의 거북이 샘플 모두의 평균 등딱지 너비를 나타내기 위해 히스토그램을 만들면 다음과 같습니다.

균일한 표본 크기 분포에 대한 중심 극한 정리 5
이 분포는 정규 분포 와 유사한 “종” 모양에 더 가깝습니다. 이는 5개의 표본을 추출할 때 표본 평균 간의 분산이 훨씬 낮기 때문에 평균이 2인치 또는 6인치에 가까운 표본을 얻을 가능성이 적고 평균이 2인치 또는 6인치에 가까운 표본을 얻을 가능성이 더 높기 때문입니다. 6인치. 평균은 실제 인구 평균에 4인치 더 가깝습니다.

이 표본분포의 평균은 x = μ = 4 입니다.

이 표본분포의 분산은 s2 = σ2 / n = 1.33 / 5 = 0.266 입니다.

균일분포에서 30개의 무작위 표본 추출

이제 동일한 실험을 반복한다고 가정해 보겠습니다. 이번에는 거북이 30마리로부터 무작위 샘플을 계속해서 채취하여 매번 평균 등딱지 너비를 찾습니다.

30마리 거북이 샘플의 평균 등딱지 너비를 나타내기 위해 히스토그램을 만들면 다음과 같습니다.

표본 크기 30에 대한 중심 극한 정리
이 샘플링 분포는 이전 두 분포보다 훨씬 더 종 모양이고 훨씬 더 좁습니다.

이 표본분포의 평균은 x = μ = 4 입니다.

이 표본분포의 분산은 s2 = σ2 / n = 1.33 / 30 = 0.044 입니다.

카이제곱 분포

특정 도시의 가족당 애완동물 수가 3개의 자유도를 갖는 카이제곱 분포를 따른다고 가정합니다. 가족별 동물 분포를 나타내기 위해 히스토그램을 만들면 다음과 같습니다.

카이제곱 분포의 중심극한정리

카이제곱 분포의 평균은 단순히 자유도(df)입니다. 이 경우 μ = 3 입니다.

카이제곱 분포의 분산은 2 * df입니다. 이 경우 σ2 = 2 * 3 = 6 입니다.

2개의 무작위 표본 추출

이 모집단에서 두 가족의 무작위 표본을 추출하고 각 가족의 애완동물 수를 계산한다고 가정해 보겠습니다. 첫 번째 가족에게는 애완동물이 4마리 있고 두 번째 가족에게는 애완동물이 1마리 있다고 가정합니다. 2가구 표본의 평균 애완동물 수는 2.5마리입니다.

그런 다음 이 모집단에서 두 가족의 또 다른 무작위 표본을 추출하고 각 가족의 애완동물 수를 다시 계산한다고 상상해 보세요. 첫 번째 가족에게는 6마리의 애완동물이 있고 두 번째 가족에게는 4마리의 애완동물이 있다고 가정합니다. 2가구 표본의 평균 애완동물 수는 5마리입니다.

두 가족으로부터 계속해서 무작위 샘플을 채취하고 매번 평균 애완동물 수를 계속 찾는다고 상상해 보세요.

두 가족의 모든 샘플에 대한 평균 애완동물 수를 나타내기 위해 히스토그램을 만든 경우 다음과 같습니다.

카이제곱 분포 표본 크기가 2인 중심 극한 정리

이 표본분포의 평균은 x = μ = 3 입니다.

이 표본분포의 분산은 s 2 = σ 2 / n = 6 / 2 = 3 입니다.

10개의 무작위 표본 추출

이제 동일한 실험을 반복한다고 가정해 보겠습니다. 이번에는 10개 가족의 무작위 표본을 계속해서 추출하여 매번 가족당 평균 동물 수를 찾습니다.

10개 가족의 표본 모두에서 가족당 평균 동물 수를 나타내기 위해 히스토그램을 만들면 다음과 같습니다.

카이제곱 분포를 이용한 중심극한정리

이 표본분포의 평균은 x = μ = 3 입니다.

이 표본분포의 분산은 s2 = σ2 / n = 6/10 = 0.6 입니다.

30개의 무작위 표본 추출

이제 동일한 실험을 반복한다고 가정해 보겠습니다. 이번에는 30개 가족의 무작위 표본을 계속해서 추출하여 매번 가족당 평균 동물 수를 찾습니다.

30개 가족의 표본 전체에서 가족당 평균 동물 수를 나타내기 위해 히스토그램을 만든 경우 다음과 같습니다.

카이제곱 분포를 사용한 중심 극한 정리의 히스토그램

이 표본분포의 평균은 x = μ = 3 입니다.

이 표본분포의 분산은 s2 = σ2 / n = 6/30 = 0.2 입니다.

요약

다음은 이 두 가지 예에서 얻을 수 있는 주요 내용입니다.

  • 모집단 분포가 정규 분포가 아니더라도 표본 크기가 충분히 크면 표본 평균의 표본 분포는 대략 정규 분포를 따릅니다 . 위의 두 예에서 균일 분포나 카이제곱 분포는 모두 정규 분포가 아니었습니다(전혀 “종” 모양이 아니었습니다). 그러나 충분히 큰 표본을 취하면 표본 평균의 분포가 다음과 같이 변환된 것으로 보입니다. 정상이 되어라.
  • 표본 크기가 클수록 표본 평균의 분산은 낮아집니다.

‘충분히 큰’을 정의하세요

중심 극한 정리에 따르면 모집단 분포가 정규 분포가 아니더라도 표본 크기가 “충분히 크면” 표본 평균의 표본 분포는 대략 정규 분포를 따릅니다.

중심 극한 정리를 적용하기 위해 표본이 얼마나 커야 하는지에 대한 정확한 정의는 없지만 일반적으로 표본이 나오는 모집단 분포의 왜도에 따라 달라집니다.

  • 모집단 분포가 대칭인 경우 15개 정도의 작은 표본 크기로도 충분할 수 있습니다.
  • 인구 분포가 치우쳐 있는 경우 일반적으로 최소 30명의 표본이 필요합니다.
  • 인구 분포가 극도로 치우친 경우 40명 이상의 표본이 필요할 수 있습니다.

이 주제에 대한 자세한 내용은 대규모 샘플 조건화에 대한 이 튜토리얼을 확인하십시오.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다