F 분포를 사용하여 신뢰 구간을 만드는 방법


두 모집단의 분산이 동일한지 확인하기 위해 분산 비율 σ 2 1 / σ 2 2 계산할 수 있습니다. 여기서 σ 2 1 은 모집단 1의 분산이고 σ 2 2 는 모집단 2의 분산입니다.

실제 모집단 분산 비율을 추정하기 위해 일반적으로 각 모집단에서 단순 무작위 표본을 추출하여 표본 분산 비율 s 1 2 / s 2 2 계산합니다. 여기서 s 1 2 및 s 2 2 는 표본 1과 표본의 표본 분산입니다. . 2, 각각.

이 검정에서는 s 1 2 및 s 2 2 가 정규 분포 모집단에서 추출된 n 1 및 n 2 크기의 독립 표본에서 계산된다고 가정합니다.

이 비율이 1에서 멀어질수록 모집단 내 분산이 불평등하다는 증거가 더 강해집니다.

σ 2 1 / σ 2 2 에 대한 (1-α)100% 신뢰구간은 다음과 같이 정의됩니다.

(s 1 2 / s 2 2 ) * F n 1 -1, n 2 -1, α/2 ≤ σ 2 1 / σ 2 2 ≤ (s 1 2 / s 2 2 ) * F n 2 -1, n 1 -1, α/2

여기서 F n 2 -1, n 1 -1, α/2 및 F n 1 -1, n 2 -1, α/2   선택한 유의 수준 α에 대한 분포 F의 임계 값입니다.

다음 예에서는 세 가지 다른 방법을 사용하여 σ 2 1 / σ 2 2 에 대한 신뢰 구간을 만드는 방법을 보여줍니다.

  • 손으로
  • 마이크로소프트 엑셀을 사용하세요
  • R 통계 소프트웨어 사용

다음 각 예에 대해 다음 정보를 사용합니다.

  • α = 0.05
  • n 1 = 16
  • n2 = 11
  • 1 2 =28.2
  • 2 2 = 19.3

신뢰 구간을 수동으로 생성

σ 2 1 / σ 2 2 에 대한 신뢰 구간을 수동으로 계산하려면, 우리가 가지고 있는 숫자를 신뢰 구간 공식에 연결하기만 하면 됩니다.

(s 1 2 / s 2 2 ) * F n1-1, n2-1,α/2 ≤ σ 2 1 / σ 2 2 ≤ (s 1 2 / s 2 2 ) * F n2-1, n1-1, α/2

우리가 누락한 유일한 숫자는 중요한 값입니다. 다행히도 분포 테이블 F 에서 이러한 중요한 값을 찾을 수 있습니다.

Fn2-1, n1-1, α/2 = F10 , 15, 0.025 = 3.0602

F n1-1, n2-1, α/2 = 1/ F 15, 10, 0.025 = 1 / 3.5217 = 0.2839

(클릭하시면 표가 확대됩니다)

알파에 대한 F 분포 테이블 = 0.025.

이제 모든 숫자를 신뢰 공식 구간에 연결할 수 있습니다.

(s 1 2 / s 2 2 ) * F n1-1, n2-1,α/2 ≤ σ 2 1 / σ 2 2 ≤ (s 1 2 / s 2 2 ) * F n2-1, n1-1, α/2

(28.2 / 19.3) * (0.2839) ≤ σ 2 1 / σ 2 2 ≤ (28.2 / 19.3) * (3.0602)

0.4148 ≤ σ 2 1 / σ 2 2 ≤ 4.4714

따라서 모집단 분산 비율에 대한 95% 신뢰 구간은 (0.4148, 4.4714) 입니다.

Excel을 사용하여 신뢰 구간 만들기

다음 이미지는 Excel에서 모집단 분산 비율에 대한 95% 신뢰 구간을 계산하는 방법을 보여줍니다. 신뢰 구간의 하한과 상한은 E 열에 표시되고 하한과 상한을 찾는 데 사용되는 공식은 F 열에 표시됩니다.

따라서 모집단 분산 비율에 대한 95% 신뢰 구간은 (0.4148, 4.4714) 입니다. 이는 신뢰 구간을 수동으로 계산할 때 얻은 것과 일치합니다.

R을 사용하여 신뢰 구간 만들기

다음 코드는 R의 모집단 분산 비율에 대한 95% 신뢰 구간을 계산하는 방법을 보여줍니다.

 #define significance level, sample sizes, and sample variances
alpha <- .05
n1 <- 16
n2 <- 11
var1 <- 28.2
var2 <- 19.3

#define F critical values
upper_crit <- 1/qf(alpha/2, n1-1, n2-1)
lower_crit <- qf(alpha/2, n2-1, n1-1)

#find confidence interval
lower_bound <- (var1/var2) * lower_crit
upper_bound <- (var1/var2) * upper_crit

#output confidence interval
paste0("(", lower_bound, ", ", upper_bound, " )")

#[1] "(0.414899337980266, 4.47137571035219 )"

따라서 모집단 분산 비율에 대한 95% 신뢰 구간은 (0.4148, 4.4714) 입니다. 이는 신뢰 구간을 수동으로 계산할 때 얻은 것과 일치합니다.

추가 리소스

F 배전반을 읽는 방법
Excel에서 임계값 F를 찾는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다