대응 t 검정으로 공식화된 세 가지 가설


쌍표본 t-검정은 한 표본의 각 관측치가 다른 표본의 관측치와 연관될 수 있는 경우 두 표본의 평균을 비교하는 데 사용됩니다.

이 유형의 테스트에서는 데이터에 대해 다음과 같은 가정을 합니다.

1. 독립성: 각 관측치는 다른 관측치와 독립되어야 합니다.

2. 정규성: 쌍 간의 차이는 대략 정규 분포를 따라야 합니다.

3. 극단적인 이상값 없음: 차이에 극단적인 이상값이 없어야 합니다.

이러한 가정 중 하나 이상이 충족되지 않으면 쌍체 표본 t-검정의 결과가 신뢰할 수 없거나 오해의 소지가 있을 수 있습니다.

이 튜토리얼에서는 각 가정에 대한 설명, 가정이 충족되는지 확인하는 방법, 위반할 경우 수행할 작업을 제공합니다.

가설 1: 독립성

대응표본 t-검정은 각 관측치가 다른 모든 관측치와 독립적이라고 가정합니다.

이 가설을 검증하는 방법

이 가정을 검증하는 가장 간단한 방법은 각 관측값이 무작위 샘플링 방법을 사용하여 수집되었는지 확인하는 것입니다.

무작위 표본 추출 방법(예: 단순 무작위 표본 추출)을 사용한 경우 각 관측값은 다른 모든 관측값과 독립적이라고 가정할 수 있습니다.

이 가정이 존중되지 않으면 어떻게 해야 할까요?

이 가정이 충족되지 않으면 쌍체 표본 t-검정의 결과는 완전히 유효하지 않습니다.

이 시나리오에서는 무작위 샘플링 방법을 사용하여 새 관측치를 수집하여 각 관측치가 독립적인지 확인하는 것이 가장 좋습니다.

가설 2: 정규성

쌍을 이루는 표본 t-검정에서는 쌍 간의 차이가 대략 정규 분포를 따라야 한다고 가정합니다.

쌍 간의 차이가 정규 분포를 따르지 않는 경우 결론을 도출하기 위해 테스트의 p-값을 사용하는 것이 유효하지 않기 때문에 이는 중요한 가정입니다.

이 가설을 검증하는 방법

이 가설을 테스트하는 가장 쉬운 방법은 단순히 쌍의 차이에 대한 히스토그램을 만들고 히스토그램이 종 모양인지 여부를 시각적으로 확인하는 것입니다.

예를 들어, 히스토그램이 다음과 같다면 정규성 가정이 충족된다고 말할 수 있습니다.

그러나 히스토그램이 다음과 같다면 정규성 가정이 충족되지 않는다고 말할 수 있습니다.

이 가정이 존중되지 않으면 어떻게 해야 할까요?

이 가정이 위반되면 Wilcoxon 부호 순위 테스트를 수행할 수 있습니다. 이는 쌍체 표본 t-검정과 동등한 비모수적 동등물로 간주되며 쌍체 차이가 정규 분포를 따른다고 가정하지 않습니다.

가설 3: 극단적인 이상값은 없습니다.

대응표본 t-검정에서는 데이터에 극단적인 특이치가 없다고 가정합니다.

이 가설을 검증하는 방법

이 가설을 테스트하는 가장 쉬운 방법은 차이 쌍의 상자 그림을 만들고 이상값이 있는지 시각적으로 확인하는 것입니다.

예를 들어, 쌍차 차이의 상자 그림이 다음과 같다고 가정합니다.

대부분의 쌍 차이는 0에 가깝지만 약 19에 해당하는 쌍 차이가 하나 있는데 이는 분명히 이상값입니다.

참고 : 원은 일반적으로 상자 그림에서 이상값을 나타내는 데 사용됩니다.

그러나 쌍차 차이의 상자 그림이 다음과 같다고 가정해 보겠습니다.

이 상자 그림에는 명확한 특이치가 없으므로 데이터에 극단적인 특이치가 없다고 가정합니다.

이 가정이 존중되지 않으면 어떻게 해야 할까요?

이 가정을 위반할 경우 쌍표본 t-검정 결과가 이상치에 의해 비정상적으로 영향을 받을 수 있습니다.

이 시나리오에서는 이상값이 잘못된 데이터 포인트를 나타내거나 데이터 입력 오류의 결과라고 생각되면 이상값을 제거할 수 있습니다.

또는 이상값을 유지하고 대응표본 t-검정 결과를 보고할 때 간단히 기록해 둘 수도 있습니다.

추가 리소스

다음 튜토리얼에서는 다른 통계 테스트에서 가정한 사항을 설명합니다.

t 검정으로 공식화된 네 가지 가설
카이제곱 검정의 네 가지 가설
파라메트릭 테스트의 네 가지 가설

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다