R에서 중심 극한 정리를 적용하는 방법(예제 포함)


중심 극한 정리 는 모집단 분포가 정규 분포가 아니더라도 표본 크기가 충분히 크면 표본 평균의 표본 분포가 대략 정규 분포를 따른다는 것입니다.

중심 극한 정리는 또한 샘플링 분포가 다음과 같은 속성을 갖는다고 명시합니다.

1. 표본분포의 평균은 모집단 분포의 평균과 같습니다.

x = μ

2. 표본분포의 표준편차는 모집단 분포의 표준편차를 표본 크기로 나눈 값과 같습니다.

s = σ /n

다음 예는 R에서 중심 극한 정리를 적용하는 방법을 보여줍니다.

예: R에서 중심 극한 정리의 적용

거북이 등껍질의 너비가 최소 너비가 2인치, 최대 너비가 6인치인 균일한 분포를 따른다고 가정합니다.

즉, 거북이를 무작위로 선택하고 등껍질의 너비를 측정하면 너비 도 2~6인치일 가능성이 높습니다.

다음 코드는 2~6인치 사이에 균등하게 분포된 1,000마리의 거북이 갑각 너비 측정값을 포함하는 R의 데이터세트를 만드는 방법을 보여줍니다.

 #make this example reproducible
set. seeds (0)

#create random variable with sample size of 1000 that is uniformly distributed
data <- runif(n=1000, min=2, max=6)

#create histogram to visualize distribution of turtle shell widths
hist(data, col=' steelblue ', main=' Histogram of Turtle Shell Widths ')

거북 등딱지 폭의 분포는 일반적으로 전혀 분포되지 않습니다.

이제 이 모집단에서 거북이 5마리의 무작위 반복 표본을 추출하고 표본 평균을 계속해서 측정한다고 상상해 보세요.

다음 코드는 R에서 이 프로세스를 수행하고 표본 평균 분포를 시각화하는 히스토그램을 만드는 방법을 보여줍니다.

 #create empty vector to hold sample means
sample5 <- c()

#take 1,000 random samples of size n=5
n = 1000
for (i in 1:n){
sample5[i] = mean(sample(data, 5, replace= TRUE ))
}

#calculate mean and standard deviation of sample means
mean(sample5)

[1] 4.008103

sd(sample5)

[1] 0.5171083 

#create histogram to visualize sampling distribution of sample means
hist(sample5, col = ' steelblue ', xlab=' Turtle Shell Width ', main=' Sample size = 5 ') 

표본 평균의 표본 분포는 표본이 나온 분포가 정규 분포가 아니었음에도 불구하고 정규 분포로 나타납니다.

또한 이 표본 분포에 대한 표본 평균과 표본 표준 편차를 확인하세요.

  • : 4.008
  • : 0.517

이제 사용하는 표본 크기를 n=5에서 n=30으로 늘리고 표본 평균의 히스토그램을 다시 생성한다고 가정합니다.

 #create empty vector to hold sample means
sample30 <- c()

#take 1,000 random samples of size n=30
n = 1000
for (i in 1:n){
sample30[i] = mean(sample(data, 30, replace= TRUE ))
}

#calculate mean and standard deviation of sample means
mean(sample30)

[1] 4.000472

sd(sample30)

[1] 0.2003791

#create histogram to visualize sampling distribution of sample means
hist(sample30, col = ' steelblue ', xlab=' Turtle Shell Width ', main=' Sample size = 30 ') 

샘플링 분포는 다시 정규 분포를 따르지만 샘플 표준 편차는 훨씬 더 작습니다.

  • : 0.200

이는 이전 예(n=5)에 비해 더 큰 표본 크기(n=30)를 사용했기 때문에 표본 평균의 표준 편차가 훨씬 더 작습니다.

계속해서 더 큰 표본을 사용하면 표본의 표준편차가 점점 작아지는 것을 알 수 있습니다.

이는 실제로 중심 극한 정리를 보여줍니다.

추가 리소스

다음 자료는 중심 극한 정리에 대한 추가 정보를 제공합니다.

중심 극한 정리 소개
중심 극한 정리 계산기
실생활에서 중심 극한 정리를 사용하는 5가지 예

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다