신뢰 구간이란 무엇입니까?

에 의해 벤자민 앤더슨 7월 28, 2023 가이드 댓글 0개

종종 통계에서 우리는 인구 매개변수 , 즉 전체 인구의 특정 특성을 설명하는 숫자를 측정하는 데 관심이 있습니다.

가장 일반적인 인구 매개변수 중 두 가지는 다음과 같습니다.

1. 모집단 평균: 모집단 내 변수의 평균값(예: 미국 남성의 평균 키)

2. 인구 비율: 인구 중 변수가 차지하는 비율(예: 특정 법률을 지지하는 카운티 거주자의 비율)

이러한 매개변수를 측정하고 싶어도 인구 매개변수를 계산하기 위해 모집단의 각 개인에 대한 데이터를 수집하는 것은 일반적으로 너무 많은 비용과 시간이 소요됩니다.

대신, 우리는 일반적으로 전체 모집단에서 무작위 표본을 추출하고 표본 데이터를 사용하여 모집단 모수를 추정합니다.

예를 들어, 플로리다에 있는 특정 거북이 종의 평균 체중을 추정한다고 가정해 보겠습니다. 플로리다에는 수천 마리의 거북이가 있기 때문에 각 거북이를 개별적으로 돌아다니며 무게를 측정하는 것은 극도로 시간과 비용이 많이 듭니다.

대신에 거북이 50마리의 간단한 무작위 표본을 추출하고 해당 표본에 있는 거북이의 평균 무게를 사용하여 실제 개체군 평균을 추정할 수 있습니다.

예시 모집단의 샘플

문제는 표본에 포함된 거북이의 평균 무게가 전체 개체군에 포함된 거북이의 평균 무게와 정확하게 일치한다고 보장할 수 없다는 것입니다. 예를 들어, 가벼운 거북이로 가득 찬 샘플을 선택할 수도 있고 무거운 거북이로 가득 찬 샘플을 선택할 수도 있습니다.

이러한 불확실성을 포착하기 위해 신뢰 구간을 만들 수 있습니다. 신뢰구간은 일정 수준의 신뢰도를 갖는 모집단 매개변수가 포함될 가능성이 있는 값의 범위입니다. 이는 다음 일반 공식에 따라 계산됩니다.

신뢰 구간 = (점 추정치) +/- (임계값)* (표준 오차)

이 공식은 하한과 상한이 있는 구간을 생성하며, 여기에는 특정 수준의 신뢰도를 갖는 모집단 매개변수가 포함될 가능성이 높습니다.

신뢰구간 = [하한, 상한]

예를 들어 모집단 평균에 대한 신뢰 구간을 계산하는 공식은 다음과 같습니다.

신뢰구간 = x +/- z*(s/ √n )

금:

x : 표본 평균
z: 선택된 z 값
s: 표본 표준편차
n: 표본 크기

사용하는 z 값은 선택한 신뢰 수준에 따라 달라집니다. 다음 표에는 가장 일반적인 신뢰 수준 선택에 해당하는 z 값이 나와 있습니다.

어느 정도의 자신감	z 값
0.90	1,645
0.95	1.96
0.99	2.58

예를 들어, 다음 정보를 사용하여 무작위로 거북이 샘플을 수집한다고 가정해 보겠습니다.

표본 크기 n = 25
평균 샘플 중량 x = 300
표본 표준편차 s = 18.5

실제 모집단 평균 체중에 대한 90% 신뢰 구간을 계산하는 방법은 다음과 같습니다.

90% 신뢰 구간: 300 +/- 1.645*(18.5/√25) = [293.91, 306.09]

우리는 이 신뢰 구간을 다음과 같이 해석합니다.

[293.91, 306.09]의 신뢰 구간에 거북이 개체군의 실제 평균 체중이 포함될 확률은 90%입니다.

같은 말을 다른 방식으로 하면 실제 모집단 평균이 90% 신뢰 구간을 벗어날 확률은 10%에 불과하다는 것입니다. 즉, 거북이 개체군의 실제 평균 체중이 306.09파운드보다 크거나 293.91파운드보다 작을 확률은 10%에 불과합니다.

신뢰 구간의 크기에 영향을 미칠 수 있는 두 개의 숫자가 있다는 것은 아무 가치가 없습니다.

1. 표본 크기: 표본 크기가 클수록 신뢰 구간은 좁아집니다.

2. 신뢰수준: 신뢰수준이 높을수록 신뢰구간은 넓어집니다.

신뢰구간 유형

신뢰구간에는 다양한 유형이 있습니다. 가장 일반적으로 사용되는 것은 다음과 같습니다.

평균에 대한 신뢰 구간

평균에 대한 신뢰구간은 일정 수준의 신뢰도를 갖는 모집단 평균이 포함될 가능성이 있는 값의 범위입니다. 이 간격을 계산하는 공식은 다음과 같습니다.

신뢰구간 = x +/- z*(s/ √n )

금:

x : 표본 평균
z: 선택된 z 값
s: 표본 표준편차
n: 표본 크기

자원:
평균에 대한 신뢰 구간을 계산하는 방법
평균 계산기의 신뢰 구간

평균 간의 차이에 대한 신뢰 구간

평균 간의 차이에 대한 신뢰구간(CI)은 일정 수준의 신뢰도를 가지고 두 모집단 평균 간의 실제 차이가 포함될 가능성이 높은 값의 범위입니다. 이 간격을 계산하는 공식은 다음과 같습니다.

신뢰 구간 = ( x ₁ – x ₂ ) +/- t*√((s _p ² /n ₁ ) + (s _p ² /n ₂ ))

금:

x ₁ , x ₂ : 표본 1의 평균, 표본 2의 평균
t: 신뢰 수준 및 (n ₁ + n ₂ -2) 자유도를 기반으로 하는 t-임계 값
s _p ² : 합동 분산
n ₁ , n ₂ : 표본 크기 1, 표본 크기 2

금:

합동 분산은 다음과 같이 계산됩니다. s _p ² = ((n ₁ -1)s ₁ ² + (n ₂ -1)s ₂ ² ) / (n ₁ +n ₂ -2)
t 임계값 t는 역 t 분포 계산기를 사용하여 찾을 수 있습니다.

자원:
평균 차이에 대한 신뢰 구간을 계산하는 방법
평균 계산기 간의 차이에 대한 신뢰 구간

비율에 대한 신뢰 구간

비율에 대한 신뢰구간은 일정 수준의 신뢰도를 갖는 모집단 비율이 포함될 가능성이 있는 값의 범위입니다. 이 간격을 계산하는 공식은 다음과 같습니다.

신뢰구간 = p +/- z*(√ p(1-p) / n )

금:

p: 표본 비율
z: 선택된 z 값
n: 표본 크기

자원:
비율에 대한 신뢰 구간을 계산하는 방법
비율 계산기의 신뢰 구간

비율 차이에 대한 신뢰 구간

비율 차이에 대한 신뢰구간은 일정 수준의 신뢰도를 가지고 두 모집단 비율의 실제 차이가 포함될 가능성이 높은 값의 범위입니다. 이 간격을 계산하는 공식은 다음과 같습니다.

신뢰 구간 = (p ₁ –p ₂ ) +/- z*√(p ₁ (1-p ₁ )/n ₁ + p ₂ (1-p ₂ )/n ₂ )

금:

p ₁ , p ₂ : 표본 1의 비율, 표본 2의 비율
z: 신뢰 수준에 따른 z 임계값
n ₁ , n ₂ : 표본 크기 1, 표본 크기 2

자원:
비율 차이에 대한 신뢰 구간을 계산하는 방법
비율 계산기의 차이에 대한 신뢰 구간

저자 소개

벤자민 앤더슨

안녕하세요. 저는 통계학 교수를 퇴직하고 전임 통계 교사로 변신한 벤자민입니다. 통계 분야의 광범위한 경험과 전문 지식을 바탕으로 Statorials를 통해 학생들에게 힘을 실어주기 위해 지식을 공유하고 싶습니다. 더 알아보기