표본 크기가 왜 중요한가요? (설명 및 예시)


표본 크기는 실험이나 연구에 참여한 총 사람 수를 나타냅니다.

표본 크기는 모집단 모수를 추정할 수 있는 정밀도에 직접적인 영향을 미치기 때문에 중요합니다.

이러한 경우가 발생하는 이유를 이해하려면 신뢰 구간에 대한 기본적인 이해가 도움이 됩니다.

신뢰 구간에 대한 간략한 설명

통계에서는 종종 인구 매개변수 (전체 인구의 특정 특성을 설명하는 숫자)를 측정하려고 합니다.

예를 들어, 특정 도시에 있는 모든 개인의 평균 키를 측정하는 데 관심이 있을 수 있습니다.

그러나 모집단의 각 개인에 대한 데이터를 수집하는 데에는 비용과 시간이 너무 많이 소요되는 경우가 많습니다. 따라서 우리는 일반적으로 모집단에서 무작위 표본을 추출하고 표본 데이터를 사용하여 모집단 모수를 추정합니다.

예를 들어, 도시에 있는 무작위 100명의 개인 키에 대한 데이터를 수집할 수 있습니다. 그런 다음 표본에 포함된 개인의 평균 크기를 계산할 수 있습니다. 그러나 표본 평균이 모집단 평균과 정확히 일치하는지 확신할 수 없습니다.

이러한 불확실성을 설명하기 위해 신뢰 구간을 만들 수 있습니다. 신뢰구간은 일정 수준의 신뢰도를 갖는 모집단 매개변수가 포함될 가능성이 있는 값의 범위입니다.

모집단 평균에 대한 신뢰 구간을 계산하는 공식은 다음과 같습니다.

신뢰구간 = x +/- z*(s/ √n )

금:

  • x : 표본 평균
  • z: 선택된 z 값
  • s: 표본 표준편차
  • n: 표본 크기

사용하는 z 값은 선택한 신뢰 수준에 따라 달라집니다. 다음 표에는 가장 일반적인 신뢰 수준 선택에 해당하는 z 값이 나와 있습니다.

어느 정도의 자신감 z 값
0.90 1,645
0.95 1.96
0.99 2.58

표본 크기와 신뢰 구간 간의 관계

거북이 개체군의 평균 체중을 추정한다고 가정해 보겠습니다. 우리는 다음 정보를 사용하여 무작위로 거북이 샘플을 수집합니다.

  • 표본 크기 n = 25
  • 평균 샘플 중량 x = 300
  • 표본 표준편차 s = 18.5

실제 모집단 평균 체중에 대한 90% 신뢰 구간을 계산하는 방법은 다음과 같습니다.

90% 신뢰 구간: 300 +/- 1.645*(18.5/√ 25 ) = [293.91, 306.09]

우리는 개체군 중 거북이의 실제 평균 체중이 293.91~306.09파운드 사이라고 90% 확신합니다.

이제 거북이 25마리 대신 거북이 50마리에 대한 데이터를 수집한다고 가정해 보겠습니다.

실제 모집단 평균 체중에 대한 90% 신뢰 구간을 계산하는 방법은 다음과 같습니다.

90% 신뢰 구간: 300 +/- 1.645*(18.5/√ 50 ) = [295.79, 304.30]

이 신뢰 구간은 이전 신뢰 구간보다 좁습니다. 이는 거북이 개체군의 실제 평균 체중에 대한 추정치가 더 정확하다는 것을 의미합니다.

이제 거북이 100마리에 대한 데이터를 수집한다고 가정해 보겠습니다.

실제 모집단 평균 체중에 대한 90% 신뢰 구간을 계산하는 방법은 다음과 같습니다.

90% 신뢰 구간: 300 +/- 1.645*(18.5/√ 100 ) = [296.96, 303.04]

이 신뢰 구간은 이전 신뢰 구간보다 훨씬 좁습니다 .

다음 표에는 각 신뢰 구간 너비가 요약되어 있습니다.

결론은 다음과 같습니다. 표본 크기가 클수록 모집단 매개변수를 더 정확하게 추정할 수 있습니다 .

추가 리소스

다음 자습서에서는 신뢰 구간과 표본 크기에 대한 더 유용한 설명을 제공합니다.

신뢰 구간 소개
4 실제 생활에서의 신뢰 구간의 예
인구 대 샘플: 차이점이 무엇인가요?

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다