T 테스트에서 공식화된 네 가지 가설


2-표본 t-검정은 두 모집단의 평균이 같은지 여부를 검정하는 데 사용됩니다.

이 유형의 테스트에서는 데이터에 대해 다음과 같은 가정을 합니다.

1. 독립성: 한 표본의 관측치는 다른 표본의 관측치와 독립적입니다.

2. 정규성: 두 표본 모두 대략적인 정규 분포를 갖습니다.

3. 분산의 동질성: 두 표본의 분산은 거의 동일합니다.

4. 무작위 샘플링: 두 샘플 모두 무작위 샘플링 방법을 사용하여 얻었습니다.

이러한 가정 중 하나 이상이 위반되면 2-표본 t-검정의 결과가 신뢰할 수 없거나 오해의 소지가 있을 수도 있습니다.

이 튜토리얼에서는 각 가정에 대한 설명, 가정이 충족되는지 확인하는 방법, 위반할 경우 수행할 작업을 제공합니다.

가설 1: 독립성

2-표본 t-검정은 한 표본의 관측치가 다른 표본의 관측치와 독립적이라고 가정합니다.

동일한 개인이 두 표본 모두에 나타나는 경우 표본 간의 차이에 대한 결론을 도출하는 것이 유효하지 않기 때문에 이는 중요한 가정입니다.

이 가설을 검증하는 방법

이 가정을 테스트하는 가장 간단한 방법은 각 관측치가 각 표본에 한 번만 나타나고 각 표본의 관측치가 무작위 샘플링으로 수집되었는지 확인하는 것입니다.

이 가정이 존중되지 않으면 어떻게 해야 할까요?

이 가정이 충족되지 않으면 2-표본 t-검정 결과가 완전히 유효하지 않습니다. 이 시나리오에서는 무작위 샘플링 방법을 사용하여 두 개의 새로운 샘플을 수집하고 한 샘플의 각 개인이 다른 샘플에 속하지 않도록 하는 것이 가장 좋습니다.

가설 2: 정규성

2-표본 t-검정에서는 두 표본이 대략적으로 정규 분포를 따른다고 가정합니다.

표본이 정규 분포를 따르지 않는 경우 검정의 p-값을 사용하여 표본 간의 차이에 대한 결론을 도출하는 것은 유효하지 않기 때문에 이는 중요한 가정입니다.

이 가설을 검증하는 방법

표본 크기가 작은 경우(n < 50) Shapiro-Wilk 테스트를 사용하여 각 표본 크기가 정규 분포를 따르는지 확인할 수 있습니다. 검정의 p-값이 특정 유의 수준보다 낮으면 데이터가 정규 분포를 따르지 않을 가능성이 높습니다.

표본 크기가 큰 경우에는 QQ 플롯을 사용하여 데이터가 정규 분포를 이루고 있는지 시각적으로 확인하는 것이 좋습니다.

QQ 플롯에서 데이터 포인트가 대략 직선 대각선을 따라 있는 경우 데이터 세트는 정규 분포를 따를 가능성이 높습니다.

이 가정이 존중되지 않으면 어떻게 해야 할까요?

이 가정이 위반되면 Mann-Whitney U 검정을 수행할 수 있습니다. 이는 2-표본 t-검정과 동등한 비모수적 검정으로 간주되며 두 표본이 정규 분포를 따른다고 가정하지 않습니다.

가설 3: 차이의 동질성

2-표본 t-검정에서는 두 표본의 분산이 거의 같다고 가정합니다.

이 가설을 검증하는 방법

우리는 두 표본 사이의 분산이 같은지 여부를 결정하기 위해 다음과 같은 경험 법칙을 사용합니다. 가장 큰 분산과 가장 작은 분산의 비율이 4보다 작으면 분산이 거의 같다고 가정하고 두 샘플 t를 모두 사용할 수 있습니다. -시험.

예를 들어, 표본 1의 분산이 24.5이고 표본 2의 분산이 15.2라고 가정합니다. 가장 큰 표본 분산과 가장 작은 표본 분산의 비율은 다음과 같이 계산됩니다.

비율: 24.5 / 15.2 = 1.61

이 비율이 4보다 작으므로 두 그룹 간의 차이가 거의 동일하다고 가정할 수 있습니다.

이 가정이 존중되지 않으면 어떻게 해야 할까요?

이 가정이 위반되면 Welch의 t-검정을 수행할 수 있습니다. 이는 2-표본 t-검정의 비모수적 버전이며 두 표본의 분산이 동일하다고 가정하지 않습니다.

가정 4: 무작위 샘플링

2-표본 t-검정에서는 두 표본 모두 무작위 표본 추출 방법을 사용하여 얻은 것으로 가정합니다.

이 가설을 검증하는 방법

이 가설을 테스트하는 데 사용할 수 있는 공식적인 통계 테스트는 없습니다. 대신, 관심 모집단의 각 개인이 하나 또는 다른 표본에 포함될 확률이 동일하도록 무작위 표본 추출 방법을 사용하여 두 표본을 모두 얻었는지 확인하면 됩니다.

이 가정이 존중되지 않으면 어떻게 해야 할까요?

이 가정이 충족되지 않으면 두 표본이 관심 모집단을 대표 할 가능성이 거의 없습니다. 이 경우 2-표본 t-검정의 결과를 전체 모집단 에 대해 안정적으로 일반화할 수 없습니다.

이 시나리오에서는 무작위 샘플링 방법을 사용하여 두 개의 새로운 샘플을 수집하는 것이 가장 좋습니다.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다