대규모 표본의 조건: 정의 및 예


통계에서는 표본을 사용하여 가설 검정 이나 신뢰 구간을 통해 모집단에 대한 결론을 도출하려는 경우가 많습니다.

가설 검정과 신뢰 구간에 사용하는 대부분의 공식은 주어진 표본이 대략 정규 분포를 따른다고 가정합니다.

그러나 이 가설을 안전하게 공식화하려면 표본 크기가 충분히 큰지 확인해야 합니다. 특히, 대규모 표본 조건이 충족되는지 확인해야 합니다.

대규모 표본 조건: 표본 크기가 30개 이상입니다.

참고: 일부 교과서에서는 “충분히 큰” 표본 크기를 최소 40으로 정의하지만 30이라는 숫자가 더 일반적으로 사용됩니다.

이 조건이 만족되면 표본평균 의 표본분포는 대략 정규분포를 이루고 있다고 가정할 수 있다. 이 가정을 통해 우리는 표본을 사용하여 표본이 추출된 모집단에 대한 결론을 도출할 수 있습니다.

30이라는 숫자를 사용하는 이유는 중심극한정리에 근거한다. 자세한 내용은 이 블로그 게시물 에서 읽어보실 수 있습니다.

예: 대규모 샘플 상태 확인

특정 기계가 크래커를 생성한다고 가정해 보겠습니다. 이 쿠키의 무게 분포는 평균 10온스, 표준 편차 2온스로 오른쪽으로 치우쳐 있습니다. 이 기계에서 생산된 100개의 쿠키에 대한 단순 무작위 표본을 추출하는 경우, 이 표본에 포함된 쿠키의 평균 무게가 9.8온스 미만일 확률은 얼마입니까?

이 질문에 대답하기 위해 일반 CDF 계산기를 사용할 수 있지만 먼저 표본 평균의 분포가 정규 분포를 따른다고 가정할 만큼 표본 크기가 충분히 큰지 확인해야 합니다.

이 예에서 샘플 크기는 n = 100 이며 이는 30보다 훨씬 큽니다. 실제 쿠키 가중치 분포가 오른쪽으로 치우쳐 있다는 사실에도 불구하고 샘플 크기가 “충분히 크므로” 분포가 다음과 같다고 가정할 수 있습니다. 표본평균은 정상이다. 따라서 우리는 이 문제를 해결하기 위해 일반 CDF 계산기를 안전하게 사용할 수 있습니다.

대형 샘플의 상태 변화

종종 표본 크기가 30보다 크거나 같으면 “충분히 크다”고 간주되지만 이 숫자는 모집단 분포의 기본 모양에 따라 약간 다를 수 있습니다.

특히:

  • 모집단 분포가 대칭인 경우 15개 정도의 작은 표본 크기로도 충분할 수 있습니다.
  • 인구 분포가 치우쳐 있는 경우 일반적으로 최소 30명의 표본이 필요합니다.
  • 인구 분포가 극도로 치우친 경우 40명 이상의 표본이 필요할 수 있습니다.

모집단 분포의 모양에 따라 중심 극한 정리를 적용하려면 표본 크기가 30보다 크거나 작아야 할 수도 있습니다.

추가 리소스

중심 극한 정리 소개
표본분포 소개

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다