샘플링 분포란 무엇입니까?


돌고래 개체수가 10,000마리이고 그 개체군에서 돌고래의 평균 무게가 300파운드라고 상상해 보세요.

이 모집단에서 돌고래 50마리의 단순 무작위 표본을 추출하면 이 표본에 포함된 돌고래의 평균 무게가 305파운드라는 것을 알 수 있습니다.

그런 다음 돌고래 50마리의 또 다른 단순 무작위 표본을 추출하면 이 표본에 포함된 돌고래의 평균 무게가 295파운드라는 것을 알 수 있습니다.

돌고래 50마리의 단순 무작위 표본을 추출할 때마다 표본에 포함된 돌고래의 평균 체중은 개체군 평균인 300파운드에 가깝지만 정확히 300파운드는 아닐 가능성이 높습니다.

이 개체군에서 돌고래 50마리의 단순 무작위 표본 200개를 추출하고 각 표본의 평균 체중에 대한 히스토그램을 생성한다고 가정해 보겠습니다.

대부분의 샘플에서 평균 무게는 300파운드에 가깝습니다. 드문 경우지만 평균 체중이 250파운드에 불과한 작은 돌고래로 가득 찬 표본을 채취할 수도 있습니다. 아니면 평균 350파운드의 큰돌고래로 가득 찬 샘플을 채취할 수도 있습니다. 일반적으로 표본 평균의 분포는 분포의 중심이 모집단의 실제 중심에 위치하는 대략 정규 분포를 따릅니다.

이러한 표본 평균 분포는 평균의 표본 추출 분포 로 알려져 있으며 다음과 같은 속성을 갖습니다.

μx = μ

여기서 μ x 는 표본 평균이고 μ는 모집단 평균입니다.

σx = σ/√n

여기서 σ x 는 표본 표준 편차, σ는 모집단 표준 편차, n은 표본 크기입니다.

예를 들어, 이 돌고래 개체군에서 평균 체중은 μ = 300입니다. 따라서 샘플링 분포의 평균은 μ x = 300 입니다.

모집단 표준편차가 18파운드라는 것도 알고 있다고 가정해 보겠습니다. 따라서 표본 표준편차는 σ x = 18/ √50 = 2.546 입니다.

비율의 샘플링 분포

같은 개체수인 돌고래 10,000마리를 생각해 보세요. 돌고래의 10%가 검은색이고 나머지는 회색이라고 가정합니다. 돌고래 50마리의 단순 무작위 표본을 추출하고 그 표본에 포함된 돌고래 중 14%가 검은색이라는 것을 알아냈다고 가정해 보겠습니다. 다음으로, 돌고래 50마리의 또 다른 단순 무작위 표본을 추출하고 이 표본에 포함된 돌고래 중 8%가 검은색이라는 것을 알아냈습니다.

이 모집단에서 돌고래 50마리의 단순 무작위 표본 200개를 추출하고 각 표본에서 검은 돌고래 비율에 대한 히스토그램을 생성한다고 가정해 보겠습니다.

대부분의 표본에서 검은돌고래의 비율은 실제 개체수인 10%에 가깝습니다. 검은돌고래 표본 비율의 분포는 분포의 중심이 모집단의 실제 중심에 위치하는 대략 정규 분포입니다.

이러한 표본 비율 분포는 표본 비율 분포 로 알려져 있으며 다음과 같은 특성을 갖습니다.

μp = P

여기서 p 는 표본 비율이고 P 는 모집단 비율입니다.

σ p = √ (P)(1-P) / n

여기서 P는 모집단 비율이고 n은 표본 크기입니다.

예를 들어, 이 돌고래 개체수에서 우리는 검은돌고래의 실제 비율이 10% = 0.1이라는 것을 알고 있습니다. 따라서 비율 표본 추출 분포의 평균은 μ p = 0.1 입니다.

모집단 표준편차가 18파운드라는 것도 알고 있다고 가정해 보겠습니다. 따라서 표본 표준편차는 σ p = √ (P)(1-P) / n = √ (.1)(1-.1) / 50 = .042 입니다.

정상성 확립

위의 공식을 사용하려면 샘플링 분포가 정규 분포를 따라야 합니다.

중심 극한 정리 에 따르면 모집단 분포가 정규 분포가 아니더라도 표본 크기가 충분히 크면 표본 평균의 표본 분포는 대략 정규 분포를 따릅니다 . 대부분의 경우 표본 크기가 30개 이상이면 충분하다고 간주합니다.

예상되는 성공 횟수와 실패 횟수가 모두 10 이상인 경우 표본 비율의 표본 분포는 대략 정규 분포입니다.

확률을 계산하기 위해 표본분포를 사용할 수 있습니다.

예 1: 특정 기계가 쿠키를 생성합니다. 이 쿠키의 무게 분포는 평균 10온스, 표준 편차 2온스로 오른쪽으로 치우쳐 있습니다. 이 기계에서 생산된 100개의 쿠키에 대한 단순 무작위 표본을 추출하는 경우, 이 표본에 포함된 쿠키의 평균 무게가 9.8온스 미만일 확률은 얼마입니까?

1단계: 정상성을 확립합니다.

표본평균의 표본분포가 정규분포인지 확인해야 합니다. 표본 크기가 30보다 크거나 같으므로 중심 극한 정리에 따라 표본 평균의 표본 분포가 정규 분포를 따른다고 가정할 수 있습니다.

2단계: 표본분포의 평균과 표준편차를 구합니다.

μx = μ

σx = σ/√n

μ x = 10온스

σ x = 2/ √100 = 2/10 = 0.2온스

3단계: Z-점수 면적 계산기를 사용하여 이 샘플의 평균 쿠키 무게가 9.8온스 미만일 확률을 확인합니다.

Z 점수 영역 계산기에 다음 숫자를 입력하세요. 이 예에서는 하나의 숫자만 찾으므로 “원시 점수 2″를 비워 둘 수 있습니다.


이 표본에 있는 쿠키의 평균 무게가 9.8온스 미만일 확률을 알고 싶기 때문에 9.8의 왼쪽 영역에 관심이 있습니다. 계산기는 이 확률이 0.15866 이라고 알려줍니다.

예 2: 학교 전체 연구에 따르면 특정 학교의 학생 중 87%가 아이스크림보다 피자를 선호합니다. 200명의 학생을 단순 무작위 표본으로 추출한다고 가정해 보겠습니다. 피자를 선호하는 학생의 비율이 85% 미만일 확률은 얼마입니까?

1단계: 정상성을 확립합니다.

예상되는 “성공” 및 “실패” 수가 모두 10개 이상인 경우 표본 비율의 표본 분포는 대략 정규 분포에 가깝습니다.

이 경우 피자를 선호할 것으로 예상되는 학생 수는 87% * 학생 200명 = 학생 174명입니다. 피자를 선호하지 않을 것으로 예상되는 학생 수는 13% * 학생 200명 = 학생 26명입니다. 이 두 숫자가 모두 10 이상이기 때문에 피자를 선호하는 학생 비율의 표본 분포가 대략 정규 분포를 따른다고 가정할 수 있습니다.

2단계: 표본분포의 평균과 표준편차를 구합니다.

μp = P

σ p = √ (P)(1-P) / n

μp = 0.87

σ p = √ (0.87)(1-0.87) / 200 = 0.024

3단계: Z-점수 면적 계산기를 사용하여 피자를 선호하는 학생 비율이 85% 미만일 확률을 확인합니다.

Z 점수 영역 계산기에 다음 숫자를 입력하세요. 이 예에서는 하나의 숫자만 찾으므로 “원시 점수 2″를 비워 둘 수 있습니다.

피자를 선호하는 학생의 비율이 85% 미만일 확률을 알고 싶기 때문에 0.85의 왼쪽 영역에 관심이 있습니다. 계산기는 이 확률이 0.20233 이라고 알려줍니다.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다