카이제곱 검정과 t-검정: 차이점은 무엇인가요?


카이제곱 테스트t-테스트는 가장 일반적인 통계 테스트 유형 중 두 가지입니다. 따라서 이 두 테스트의 차이점을 이해하고 답변하려는 문제에 따라 각 테스트를 언제 사용해야 하는지 아는 방법을 이해하는 것이 중요합니다.

이 튜토리얼에서는 두 테스트의 차이점과 사용 시기를 간단하게 설명합니다.

카이제곱 검정

실제로 카이제곱 검정에는 여러 가지 버전이 있지만 가장 일반적인 것은 카이제곱 독립성 검정 입니다.

정의

두 범주형 변수 사이에 통계적으로 유의미한 연관성이 있는지 여부를 공식적으로 테스트하려는 경우 카이제곱 독립성 테스트를 사용합니다.

테스트 가설은 다음과 같습니다.

귀무 가설 (H 0 ): 두 변수 사이에는 유의미한 연관성이 없습니다.

대립 가설: (Ha): 두 변수 사이에 유의미한 연관성이 있습니다 .

다음은 독립성을 위해 카이제곱 검정을 사용할 수 있는 경우의 몇 가지 예입니다.

예 1: 성별(남성, 여성)과 정당 선호도(공화당, 민주당, 무소속) 사이에 통계적으로 유의미한 연관성이 있는지 알고 싶습니다. 이를 테스트하기 위해 무작위로 100명의 사람들을 대상으로 설문조사를 실시하고 그들의 성별과 정당 선호도를 기록할 수 있습니다. 그런 다음 카이제곱 테스트를 수행하여 성별과 정당 선호도 사이에 통계적으로 유의미한 연관성이 있는지 확인할 수 있습니다.

예 2: 학급 수준(1학년, 2학년, 3학년, 4학년)과 좋아하는 영화 장르(스릴러, 드라마, 서부) 사이에 통계적으로 유의미한 연관성이 있는지 알고 싶습니다. 이를 테스트하기 위해 특정 학교의 각 학년에서 무작위로 100명의 학생을 대상으로 설문조사를 실시하고 그들이 가장 좋아하는 영화 장르를 기록할 수 있습니다. 다음으로, 학년 수준과 좋아하는 영화 장르 사이에 통계적으로 유의미한 연관성이 있는지 확인하기 위해 카이제곱 독립성 검정을 수행할 수 있습니다.

예 3: 우리는 개인이 좋아하는 스포츠(농구, 야구, 축구)와 자란 곳(도시, 시골) 사이에 통계적으로 유의미한 연관성이 있는지 알고 싶습니다. 이를 테스트하기 위해 무작위로 100명을 대상으로 설문조사를 실시하고 어떤 유형의 장소에서 자랐는지, 가장 좋아하는 스포츠는 무엇인지 물어볼 수 있습니다. 다음으로 카이제곱 테스트를 수행하여 개인이 좋아하는 스포츠와 성장 장소 사이에 통계적으로 유의미한 연관성이 있는지 확인할 수 있습니다.

가설

독립성에 대한 카이제곱 테스트를 수행하려면 먼저 테스트의 타당성을 보장하기 위해 다음 가정이 충족되는지 확인해야 합니다.

  • 무작위: 두 표본 모두에서 데이터를 수집하려면 무작위 표본 또는 무작위 실험을 사용해야 합니다.
  • 범주형: 우리가 연구하는 변수는 범주형이어야 합니다.
  • 크기: 변수의 각 수준에서 예상되는 관측치 수는 5 이상이어야 합니다.

이러한 가정이 확인되면 테스트를 수행할 수 있습니다.

t-테스트

t-검정에는 몇 가지 다른 버전도 있지만 가장 일반적인 것은 평균 차이에 대한 t-검정 입니다.

정의

두 모집단 평균 사이에 통계적으로 유의미한 차이가 있는지 여부를 공식적으로 테스트하려는 경우 평균 차이 에 대해 t-검정을 사용합니다.

테스트 가설은 다음과 같습니다.

귀무 가설 (H 0 ): 두 모집단의 평균이 동일합니다.

대립 가설: (Ha): 두 모집단의 평균이 동일하지 않습니다.

참고: 한 모집단 평균이 다른 모집단 평균보다 높거나 낮은지 테스트할 수 있지만 가장 일반적인 귀무 가설은 두 평균이 같다는 것입니다.

다음은 평균의 차이를 확인하기 위해 t-검정을 사용할 수 있는 경우에 대한 몇 가지 예입니다.

예 1: 우리는 다이어트 A 또는 다이어트 B가 더 큰 체중 감소를 가져오는지 알고 싶습니다. 우리는 무작위로 100명을 다이어트 A를 2개월 동안 따르고 다른 100명은 다이어트 B를 2개월 동안 따르도록 지정했습니다. 두 그룹 간의 평균 체중 감소에 통계적으로 유의미한 차이가 있는지 확인하기 위해 t-테스트를 수행할 수 있습니다.

예 2: 우리는 두 가지 다른 학습 계획으로 인해 학생들의 시험 결과가 달라지는지 알고 싶습니다. 시험 전 한 달 동안 50명의 학생에게 하나의 학습 계획을 사용하고 50명의 학생에게 다른 학습 계획을 사용하도록 무작위로 할당합니다. 두 학습 계획 간의 평균 시험 점수에 통계적으로 유의미한 차이가 있는지 확인하기 위해 평균 차이를 확인하기 위해 t-테스트를 수행할 수 있습니다.

예 3: 서로 다른 두 학교의 학생들의 평균 키가 동일한지 알고 싶습니다. 우리는 한 학교에서 무작위로 100명의 학생과 다른 학교에서 무작위로 100명의 학생의 키를 측정합니다. 두 학교 간의 평균 학생 키에 통계적으로 유의미한 차이가 있는지 확인하기 위해 평균 차이에 대한 t-테스트를 수행할 수 있습니다.

가설

두 모집단 평균 간의 차이에 대한 가설 검정을 수행하기 전에 먼저 가설 검정의 타당성을 보장하기 위해 다음 조건이 충족되는지 확인해야 합니다.

  • 무작위: 두 표본 모두에 대한 데이터를 수집하려면 무작위 표본 또는 무작위 실험을 사용해야 합니다.
  • 정규: 샘플링 분포가 정규 또는 대략 정규입니다.
  • 독립성: 두 표본이 독립적입니다.

이러한 가정이 만족되면 가설 검정을 수행할 수 있습니다.

각 테스트를 언제 사용해야 하는지 아는 방법

각 테스트에 대한 간략한 요약은 다음과 같습니다.

독립성에 대한 카이제곱 검정:범주형 변수 사이에 통계적으로 유의미한 연관성이 있는지 여부를 검정할 수 있습니다. 카이제곱 독립성 검정에서 귀무가설을 기각하는 경우 이는 두 변수 사이에 유의미한 연관성이 있음을 의미합니다.

평균 t-검정의 차이: 두 모집단 평균 간에 통계적으로 유의미한 차이가 있는지 여부를 검정할 수 있습니다. 평균 차이에 대한 t-검정의 귀무가설을 기각하면 두 모집단의 평균이 동일하지 않다는 의미입니다.

카이제곱 검정과 t-검정을 사용할지 여부를 알 수 있는 가장 쉬운 방법은 작업 중인 변수의 유형을 살펴보는 것입니다.

두 개의 변수가 모두 범주형인 경우, 즉 남성 , 여성 , 공화당 , 민주당 , 독립 등 의 범주에 배치할 수 있는 경우 카이제곱 검정을 사용해야 합니다.

그러나 한 변수가 범주형 (예: 학습 계획 유형 – 계획 1 또는 계획 2)이고 다른 변수가 연속형(예: 시험 점수 – 0에서 100까지 측정)인 경우 t-검정을 사용해야 합니다.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다