평균 간의 차이에 대한 신뢰 구간


평균 간의 차이에 대한 신뢰구간(CI)은 일정 수준의 신뢰도를 가지고 두 모집단 평균 간의 실제 차이가 포함될 가능성이 높은 값의 범위입니다.

이 튜토리얼에서는 다음 내용을 설명합니다.

  • 이 신뢰 구간을 만드는 동기입니다.
  • 이 신뢰 구간을 생성하는 공식입니다.
  • 이 신뢰 구간을 계산하는 방법의 예입니다.
  • 이 신뢰 구간을 해석하는 방법.

평균의 차이에 대한 CI: 동기부여

연구자들은 종종 두 모집단의 평균 차이를 추정하려고 합니다. 이 차이를 추정하기 위해 각 모집단에서 무작위 표본을 수집하고 각 표본의 평균을 계산합니다. 그런 다음 두 평균 간의 차이를 비교할 수 있습니다.

그러나 표본 평균 간의 차이가 모집단 평균 간의 실제 차이와 일치하는지 여부는 확실히 알 수 없습니다. 이것이 두 평균 간의 차이에 대한 신뢰 구간을 만들 수 있는 이유입니다. 이는 모집단 평균 간의 실제 차이를 포함할 가능성이 있는 값의 범위를 제공합니다.

예를 들어, 서로 다른 두 종의 거북이 사이의 평균 체중 차이를 추정한다고 가정해 보겠습니다. 각 개체군에는 수천 마리의 거북이가 있기 때문에 각 거북이를 개별적으로 돌아다니며 무게를 측정하는 것은 너무 많은 시간과 비용이 소요됩니다.

대신, 각 개체군에서 15마리의 거북이를 단순 무작위 표본으로 추출하고 각 표본의 평균 체중을 사용하여 두 개체군 간의 평균 체중의 실제 차이를 추정할 수 있습니다.

두 모집단 평균 간의 차이에 대한 신뢰 구간

문제는 표본이 무작위이기 때문에 두 표본 간의 평균 체중 차이가 두 모집단 간의 평균 체중 차이와 정확히 일치한다고 보장할 수 없다는 것입니다. 따라서 이러한 불확실성을 포착하기 위해 두 모집단 간의 실제 평균 체중 차이를 포함할 가능성이 있는 값 범위를 포함하는 신뢰 구간을 만들 수 있습니다.

평균 간의 차이에 대한 CI: 공식

다음 공식을 사용하여 두 평균 간의 차이에 대한 신뢰 구간을 계산합니다.

신뢰 구간 = ( x 1x 2 ) +/- t*√((s p 2 /n 1 ) + (s p 2 /n 2 ))

금:

  • x 1 , x 2 : 표본 1의 평균, 표본 2의 평균
  • t: 신뢰 수준 및 (n 1 + n 2 -2) 자유도를 기반으로 하는 t-임계 값
  • s p 2 : 합동 분산
  • n 1 , n 2 : 표본 크기 1, 표본 크기 2

금:

  • 합동 분산은 다음과 같이 계산됩니다. s p 2 = ((n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2)
  • t 임계값 t는 역 t 분포 계산기를 사용하여 찾을 수 있습니다.

평균 간의 차이에 대한 CI:

서로 다른 두 종의 거북이 사이의 평균 체중 차이를 추정한다고 가정해 보겠습니다. 따라서 우리는 각 개체군에서 15마리의 거북이를 무작위로 추출할 것입니다. 각 샘플의 요약 데이터는 다음과 같습니다.

샘플 1:

  • x1 = 310
  • 1 = 18.5
  • n 1 = 15

샘플 2:

  • x2 = 300
  • s2 = 16.4
  • n2 = 15

모집단 평균 체중의 실제 차이에 대한 다양한 신뢰 구간을 찾는 방법은 다음과 같습니다.

90% 신뢰 구간:

(310-300) +/- 1.70*√((305.61/15) + (305.61/15)) = [-0.8589, 20.8589]

95% 신뢰 구간:

(310-300) +/- 2.05*√((305.61/15) + (305.61/15)) = [-3.0757, 23.0757]

99% 신뢰 구간:

(310-300) +/- 2.76*√((305.61/15) + (305.61/15)) = [-7.6389, 27.6389]

참고: 평균 차이 계산기에 대한 통계적 신뢰 구간을 사용하여 이러한 신뢰 구간을 찾을 수도 있습니다.

신뢰 수준이 높을수록 신뢰 구간이 넓어지는 것을 알 수 있습니다. 간격이 넓을수록 실제 모집단 평균이 포함될 가능성이 높으므로 간격에 실제 모집단 평균이 포함되어 있다고 더 “신뢰”할 수 있으므로 이는 의미가 있습니다.

평균의 차이에 대한 CI : 해석

신뢰 구간을 해석하는 방법은 다음과 같습니다.

[-3.0757, 23.0757]의 신뢰 구간에 두 거북이 개체군 간의 실제 평균 체중 차이가 포함될 확률은 95%입니다.

이 간격에는 “0” 값이 포함되어 있으므로 이는 두 개체군 거북이의 평균 체중에 차이가 없을 가능성이 있음을 의미합니다. 즉, 우리는 이 두 개체군의 거북이 사이에 평균 체중에 차이가 있다고 95% 신뢰도로 말할 수 없습니다.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다