정규분포와 t분포: 차이점은 무엇인가요?


정규분포 는 모든 통계에서 가장 일반적으로 사용되는 분포로 대칭적이고 종 모양의 분포로 알려져 있다.

밀접하게 관련된 분포는 대칭이고 종 모양이지만 정규 분포보다 “꼬리”가 더 무거운 t 분포 입니다.

즉, 정규분포에 비해 분포의 값이 중앙보다 양끝에 더 많이 위치합니다.

정규 분포와 t 분포

통계 전문 용어로 첨도 라는 측정항목을 사용하여 분포가 얼마나 “무거운지” 측정합니다. 따라서 t 분포의 첨도가 정규 분포의 첨도보다 크다고 말할 수 있습니다.

실제로 우리는 가설 검정을 수행하거나 신뢰 구간을 구성할 때 t 분포를 가장 자주 사용합니다.

예를 들어 모집단 평균에 대한 신뢰 구간을 계산하는 공식은 다음과 같습니다.

신뢰구간 = x +/- t 1-α/2, n-1 *(s/ √n )

금:

  • x : 표본 평균
  • t: 유의 수준 α 및 표본 크기 n을 기반으로 하는 임계 t 값
  • s: 표본 표준편차
  • n: 표본 크기

이 공식에서는 다음 조건 중 하나가 참인 경우 테이블 z의 임계값 대신 테이블 t의 임계값을 사용합니다.

  • 우리는 모집단 표준편차를 모릅니다.
  • 표본 크기는 30보다 작거나 같습니다.

다음 순서도는 테이블 t 또는 테이블 z의 임계 값을 사용해야 하는지 여부를 알 수 있는 유용한 방법을 제공합니다.

테이블 Z 대 테이블 t

신뢰 구간을 구성할 때 t 분포를 사용하는 것과 정규 분포를 사용하는 것의 주요 차이점은 t 분포의 임계 값이 더 커져 신뢰 구간이 더 넓어진 다는 것입니다.

예를 들어, 다음 정보를 사용하여 무작위 거북이 샘플을 수집하기 위해 거북이 개체군의 평균 체중에 대한 95% 신뢰 구간을 구축한다고 가정합니다.

  • 표본 크기 n = 25
  • 평균 샘플 중량 x = 300
  • 표본 표준편차 s = 18.5

95% 신뢰 수준에 대한 임계 z 값은 1.96 이고 df = 25-1 = 24 자유도인 95% 신뢰 구간에 대한 임계 t 값은 2.0639 입니다.

따라서 z 임계값을 사용하는 모집단 평균에 대한 95% 신뢰 구간은 다음과 같습니다.

95% CI = 300 +/- 1.96*(18.5/√ 25 ) = [292.75, 307.25]

t-임계 값을 사용하는 모집단 평균의 95% 신뢰 구간은 다음과 같습니다.

95% CI = 300 +/- 2.0639*(18.5/√25) = [292.36, 307.64]

t-임계 값의 신뢰 구간이 더 넓습니다.

여기서 아이디어는 표본 크기가 작을 때 실제 모집단 평균을 덜 확신하므로 t 분포를 사용하여 실제 모집단 평균을 포함할 가능성이 더 높은 더 넓은 신뢰 구간을 생성하는 것이 유용하다는 것입니다.

t 분포의 자유도 시각화

자유도가 증가할수록 t분포는 정규분포에 가까워진다는 점에 유의해야 합니다.

이를 설명하기 위해 다음 자유도를 갖는 t 분포의 모양을 보여주는 다음 그래프를 고려하십시오.

  • df = 3
  • df = 10
  • df = 30

정규 또는 t 분포 그래프

자유도가 30을 넘으면 t 분포와 정규 분포가 너무 유사해져서 공식에서 t 임계값과 z 임계값을 사용하는 것의 차이가 무시할 수 있게 됩니다.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다