Anova에서 제곱합을 계산하는 방법(예제 포함)


통계에서는 일원 분산 분석(one-way ANOVA)을 사용하여 3개 이상의 독립 그룹의 평균을 비교하여 해당 모집단의 평균 간에 통계적으로 유의한 차이가 있는지 확인합니다.

일원 분산 분석을 수행할 때마다 항상 세 가지 제곱합 값을 계산합니다.

1. 제곱합 회귀(SSR)

  • 각 그룹의 평균과 전체 평균 의 차이를 제곱한 값의 합입니다.

2. 제곱합 오류(SSE)

  • 이는 각 개별 관측치와 해당 관측치의 그룹 평균 간의 차이를 제곱한 값의 합입니다.

3. 총 제곱합(SST)

  • 이는 각 개별 관측치와 전체 평균 간의 차이를 제곱한 값의 합입니다.

이 세 가지 값 각각은 최종 ANOVA 테이블에 배치되며, 이를 사용하여 그룹 평균 간에 통계적으로 유의미한 차이가 있는지 여부를 결정합니다.

다음 예에서는 실제로 일원 분산 분석에 대한 이러한 각 제곱합 값을 계산하는 방법을 보여줍니다.

예: ANOVA에서 제곱합을 계산하는 방법

세 가지 서로 다른 시험 준비 프로그램이 특정 시험에서 서로 다른 평균 점수를 가져오는지 여부를 알고 싶다고 가정해 보겠습니다. 이를 테스트하기 위해 우리는 연구에 참여할 학생 30명을 모집하고 그들을 세 그룹으로 나눕니다.

각 그룹의 학생들은 시험 준비를 위해 다음 3주 동안 세 가지 시험 준비 프로그램 중 하나를 사용하도록 무작위로 배정됩니다. 3주 후에는 모든 학생들이 동일한 시험을 치릅니다.

각 그룹의 시험 결과는 다음과 같습니다.

일원 분산 분석 데이터의 예

다음 단계에서는 이 일원 분산 분석에 대한 제곱 값의 합을 계산하는 방법을 보여줍니다.

1단계: 그룹 평균과 전체 평균을 계산합니다.

먼저 세 그룹의 평균과 전체(또는 “전체”) 평균을 계산합니다.

2단계: SSR을 계산합니다.

다음으로, 다음 공식을 사용하여 SSR(제곱합 회귀)을 계산합니다.

nΣ(X jX ..) 2

금:

  • n : 그룹 j의 표본 크기
  • Σ : “합계”를 의미하는 그리스 기호
  • X j : 그룹 j의 평균
  • X .. : 전체 평균

이 예에서는 SSR = 10(83.4-85.8) 2 + 10(89.3-85.8) 2 + 10(84.7-85.8) 2 = 192.2 로 계산됩니다.

3단계: SES를 계산합니다.

다음으로, 다음 공식을 사용하여 SSE(제곱합 오류)를 계산합니다.

Σ( XijXj ) 2

금:

  • Σ : “합계”를 의미하는 그리스 기호
  • X ij : 그룹 j의 i번째 관측치
  • X j : 그룹 j의 평균

이 예에서는 SSE를 다음과 같이 계산합니다.

그룹 1: (85-83.4) 2 + (86-83.4) 2 +   (88-83.4) 2 +   (75-83.4) 2 +   (78-83.4) 2 +   (94-83.4) 2 +   (98-83.4) 2 +   (79-83.4) 2 +   (71-83.4) 2 +   (80-83.4) 2 = 640.4

그룹 2: (91-89.3) 2 + (92-89.3) 2 +   (93-89.3) 2 +   (85-89.3) 2 +   (87-89.3) 2 +   (84-89.3) 2 +   (82-89.3) 2 +   (88-89.3) 2 +   (95-89.3) 2 +   (96-89.3) 2 = 208.1

그룹 3: (79-84.7) 2 + (78-84.7) 2 +   (88-84.7) 2 +   (94-84.7) 2 +   (92-84.7) 2 +   (85-84.7) 2 +   (83-84.7) 2 +   (85-84.7) 2 +   (82-84.7) 2 +   (81-84.7) 2 = 252.1

ESS: 640.4 + 208.1 + 252.1 = 1,100.6

4단계: SST를 계산합니다.

다음으로, 다음 공식을 사용하여 총 제곱합(SST)을 계산합니다.

SST = SSR + SSE

이 예에서는 SST = 192.2 + 1100.6 = 1292.8

SSR, SSE 및 SST 값을 계산하면 이러한 각 값이 최종적으로 ANOVA 테이블에 배치됩니다.

원천 제곱합(SS) df 평균 제곱(MS) F값 p-값
회귀 192.2 2 96.1 2,358 0.1138
오류 1100.6 27 40.8
1292.8 29

다음은 표의 다양한 숫자를 계산하는 방법입니다.

  • 회귀 df: k-1 = 3-1 = 2
  • 오류 df: nk = 30-3 = 27
  • 총 df: n-1 = 30-1 = 29
  • SEP 처리: SST 처리/df = 192.2 / 2 = 96.1
  • MS 오류: SSE 오류 / df = 1100.6 / 27 = 40.8
  • F 값: MS 처리 / MS 오류 = 96.1 / 40.8 = 2.358
  • p-값 : F 값에 해당하는 p-값입니다.

참고: n = 총 관측치 수, k = 그룹 수

ANOVA 테이블에서 F 값과 p 값을 해석하는 방법을 알아보려면 이 튜토리얼을 확인하세요.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다