P 값 대 알파: 차이점이 무엇인가요?


학생들이 통계에서 자주 혼동하는 두 가지 용어는 p-값알파 입니다.

두 용어 모두 가설 검정 에 사용됩니다. 이는 가설을 기각하거나 기각하지 못하는 데 사용하는 공식적인 통계 테스트입니다.

예를 들어, 새로운 약이 현재의 표준 약보다 환자의 혈압을 더 많이 감소시킨다는 가설을 가정해 보겠습니다.

이를 테스트하기 위해 다음과 같은 귀무 가설과 대립 가설을 정의하는 가설 테스트를 수행할 수 있습니다.

귀무 가설: 새로운 약과 표준 약 사이에는 차이가 없습니다.

대립가설: 새로운 알약과 표준 알약 사이에는 차이가 있습니다 .

귀무가설이 참이라고 가정하면 검정의 p-값은 최소한 표본 데이터에서 실제로 관찰한 효과만큼 큰 효과를 얻을 확률을 알려줍니다.

예를 들어, 가설 검정의 p-값이 0.02라고 가정합니다.

이 p-값을 해석하는 방법은 다음과 같습니다. 새 알약과 표준 알약 사이에 실제로 차이가 없다면 이 가설 테스트를 실행하는 횟수의 2%는 데이터 샘플에서 관찰된 효과 이상을 얻게 됩니다. 단순히 무작위 샘플링 오류 때문입니다.

이는 새로운 알약과 표준 알약 사이에 실제로 차이가 없다면 우리가 실제로 수행한 데이터 샘플을 얻는 것이 다소 드물다는 것을 말해줍니다.

따라서 우리는 귀무 가설을 기각하고 새로운 약과 표준 약 사이에 차이가 있다고 결론을 내리는 경향이 있습니다.

하지만 p-값이 귀무 가설을 기각할 만큼 충분히 낮은지 확인하려면 어떤 임계값을 사용해야 할까요?

알파가 들어오는 곳입니다!

알파 레벨

가설 검정의 알파 수준 은 p-값이 귀무 가설을 기각할 만큼 낮은지 여부를 결정하는 데 사용하는 임계값입니다. 0.05로 설정되는 경우가 많지만, 0.01이나 0.10으로 설정되는 경우도 있습니다.

예를 들어, 가설 검정의 알파 수준을 0.05로 설정하고 p-값 0.02를 얻으면 p-값이 알파 수준보다 작으므로 귀무 가설을 기각합니다. 따라서 우리는 대립 가설이 참이라고 말할 수 있는 충분한 증거를 가지고 있다고 결론을 내릴 수 있습니다.

알파 수준은 실제 귀무 가설을 잘못 기각할 확률도 정의한다는 점에 유의하는 것이 중요합니다.

예를 들어, 새 약과 현재 약 사이의 평균 혈압 감소에 차이가 있는지 여부를 테스트한다고 가정해 보겠습니다. 그리고 두 알약 사이에 차이가 없다고 가정해 봅시다.

가설 검정의 알파 수준을 0.05로 설정하면 이는 가설 검정 과정을 여러 번 반복하면 약 5%의 경우에서 귀무 가설을 잘못 기각할 것으로 예상된다는 의미입니다. 테스트.

알파 레벨 선택 방법

앞서 언급했듯이 가설 검정의 알파 수준에 대한 가장 일반적인 선택은 0.05입니다. 그러나 잘못된 결론이 심각한 결과를 초래하는 일부 상황에서는 알파 수준을 0.01 정도로 더 낮게 설정할 수 있습니다.

예를 들어 의료 분야에서는 연구자들이 가설 검정 결과를 신뢰할 수 있는지 확인하기 위해 알파 수준을 0.01로 설정하는 것이 일반적입니다.

반대로 마케팅과 같은 분야에서는 실수의 결과가 생사도 아니기 때문에 알파 수준을 0.10과 같이 더 높게 설정하는 것이 더 일반적일 수 있습니다.

테스트의 알파 수준을 높이면 유의성 테스트 결과를 찾을 가능성이 높아지지만 실제 귀무 가설을 잘못 기각할 가능성도 높아진다는 점에 유의해야 합니다.

요약:

이 기사에서 배운 내용은 다음과 같습니다.

1. p-값은 최소한 표본 데이터에서 실제로 관찰한 효과만큼 큰 효과를 얻을 확률을 알려줍니다.

2. 알파 수준은 실제 귀무가설을 잘못 기각할 확률입니다.

3. 가설 검정의 p-값이 알파 수준보다 작으면 귀무 가설을 기각할 수 있습니다.

4. 테스트의 알파 수준을 높이면 중요한 테스트 결과를 찾을 가능성이 높아지지만 실제 귀무 가설을 잘못 기각할 가능성도 높아집니다.

추가 리소스

가설 검정 소개
귀무 가설을 작성하는 방법(5개 예)
좌파와 좌파를 식별하는 방법 올바른 테스트

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다