귀무가설을 언제 기각해야 할까요? (예시 3개)
가설 테스트는 통계적 가설을 기각하거나 기각하지 못하는 데 사용하는 공식적인 통계 테스트입니다.
우리는 가설 검정을 수행하기 위해 항상 다음 단계를 사용합니다.
1단계: 귀무가설과 대립가설을 진술합니다.
H0 로 표시되는 귀무가설은 표본 데이터가 우연에서만 나온다는 가설입니다.
HA 로 표시되는 대립 가설은 표본 데이터가 무작위가 아닌 원인에 의해 영향을 받는다는 가설입니다.
2. 사용할 유의 수준을 결정합니다.
중요성의 수준을 결정하십시오. 일반적인 선택은 .01, .05 및 .1입니다.
3. 검정 통계량과 p-값을 계산합니다.
표본 데이터를 사용하여 검정 통계량과 해당 p-값을 계산합니다.
4. 귀무가설을 기각하거나 기각하지 않습니다.
p-값이 유의 수준보다 낮으면 귀무 가설을 기각합니다.
p-값이 유의 수준보다 낮지 않으면 귀무 가설을 기각할 수 없습니다.
이 규칙을 기억하려면 다음과 같은 멋진 줄을 사용할 수 있습니다.
“p가 약하면 null은 사라져야 합니다.”
즉, p-값이 충분히 낮으면 귀무 가설을 기각해야 합니다.
다음 예에서는 가장 일반적인 유형의 가설 검정에 대한 귀무 가설을 기각(또는 기각하지 않음)하는 경우를 보여줍니다.
예 1: 일표본 t-검정
단일 표본 t-검정은 모집단의 평균이 특정 값과 같은지 여부를 검정하는 데 사용됩니다.
예를 들어, 특정 거북이 종의 평균 무게가 310파운드인지 알고 싶다고 가정해 보겠습니다.
우리는 다음 정보를 사용하여 거북이 40마리의 간단한 무작위 표본을 수집합니다.
- 표본 크기 n = 40
- 평균 샘플 중량 x = 300
- 표본 표준편차 s = 18.5
다음 단계를 사용하여 단일 표본 t-검정을 수행할 수 있습니다.
1단계: 귀무가설과 대립가설 명시
다음 가설을 사용하여 단일 표본 t-검정을 수행합니다.
- H 0 : μ = 310 (인구 평균은 310권과 동일)
- H A : μ ≠ 310 (인구 평균은 310파운드와 동일하지 않음)
2. 사용할 유의 수준을 결정합니다.
우리는 유의수준 0.05 를 사용하기로 하겠습니다.
3. 검정 통계량과 p-값을 계산합니다.
표본 크기, 표본 평균, 표본 표준 편차에 대한 숫자를 이 1표본 t-검정 계산기 에 연결하여 검정 통계량과 p-값을 계산할 수 있습니다.
- t-검정 통계: -3.4187
- 양측 p-값: 0.0015
4. 귀무가설을 기각하거나 기각하지 않습니다.
p-값(0.0015)이 유의 수준(0.05)보다 작으므로 귀무 가설을 기각합니다 .
우리는 이 개체군의 평균 거북이 무게가 310파운드가 아니라는 충분한 증거가 있다고 결론을 내렸습니다.
예 2: 2-표본 t-검정
2-표본 t-검정은 두 모집단의 평균이 같은지 여부를 검정하는 데 사용됩니다.
예를 들어, 서로 다른 두 종의 거북이의 평균 체중이 같은지 여부를 알고 싶다고 가정해 보겠습니다.
우리는 다음 정보를 사용하여 각 모집단에서 단순 무작위 표본을 수집합니다.
샘플 1:
- 표본 크기 n 1 = 40
- 평균 샘플 중량 x 1 = 300
- 표본 표준 편차 s 1 = 18.5
샘플 2:
- 표본 크기 n 2 = 38
- 평균 샘플 중량 x 2 = 305
- 표본 표준 편차 s 2 = 16.7
다음 단계를 사용하여 2-표본 t-검정을 수행할 수 있습니다.
1단계: 귀무가설과 대립가설 명시
다음 가정을 사용하여 2-표본 t-검정을 수행합니다.
- H 0 : μ 1 = μ 2 (두 모집단 평균이 동일함)
- H 1 : μ 1 ≠ μ 2 (두 모집단 평균이 동일하지 않음)
2. 사용할 유의 수준을 결정합니다.
우리는 유의수준 0.10 을 사용하기로 선택하겠습니다.
3. 검정 통계량과 p-값을 계산합니다.
표본 크기, 표본 평균 및 표본 표준 편차에 대한 숫자를 이 2-표본 t-검정 계산기 에 연결하여 검정 통계량과 p-값을 계산할 수 있습니다.
- t-검정 통계: -1.2508
- 양측 p-값: 0.2149
4. 귀무가설을 기각하거나 기각하지 않습니다.
p-값(0.2149)이 유의 수준(0.10)보다 작지 않으므로 귀무 가설을 기각할 수 없습니다 .
이 두 개체군 사이의 거북이 평균 체중이 다르다고 말할 수 있는 충분한 증거가 없습니다.
예 3: 대응표본 t-검정
쌍표본 t-검정은 한 표본의 각 관측치가 다른 표본의 관측치와 연관될 수 있는 경우 두 표본의 평균을 비교하는 데 사용됩니다.
예를 들어, 특정 훈련 프로그램이 대학 농구 선수의 최대 수직 점프를 증가시킬 수 있는지 여부를 알고 싶다고 가정해 보겠습니다.
이를 테스트하기 위해 대학 농구 선수 20명의 단순 무작위 표본을 모집하고 각각의 최대 수직 점프를 측정할 수 있습니다. 그런 다음 각 선수에게 한 달 동안 훈련 프로그램을 사용하게 한 다음 월말에 최대 수직 점프를 다시 측정하도록 할 수 있습니다.
다음 단계를 사용하여 대응 표본 t-검정을 수행할 수 있습니다.
1단계: 귀무가설과 대립가설 명시
다음 가설을 사용하여 쌍을 이루는 표본에 대해 t-검정을 수행합니다.
- H 0 : 이전의 μ = 이후의 μ(두 모집단 평균은 동일함)
- H 1 : 이전의 μ ≠ 이후의 μ(두 모집단 평균이 동일하지 않음)
2. 사용할 유의 수준을 결정합니다.
우리는 유의수준 0.01을 사용하기로 선택하겠습니다.
3. 검정 통계량과 p-값을 계산합니다.
각 표본의 원시 데이터를 이 쌍 표본 t-검정 계산기 에 연결하여 검정 통계량과 p-값을 계산할 수 있습니다.
- t-검정 통계: -3.226
- 양측 p-값: 0.0045
4. 귀무가설을 기각하거나 기각하지 않습니다.
p-값(0.0045)이 유의 수준(0.01)보다 작으므로 귀무 가설을 기각합니다 .
훈련 프로그램 참여 전과 후의 평균 수직 점프가 동일하지 않다고 말할 수 있는 충분한 증거가 있습니다.
보너스: 의사결정 규칙 계산기
이 결정 규칙 계산기를 사용하면 검정 통계량 값을 기반으로 가설 검정에 대한 귀무 가설을 기각할지 여부를 자동으로 결정할 수 있습니다.