Anova에서 제곱합을 계산하는 방법(예제 포함)

에 의해 벤자민 앤더슨 7월 19, 2023 가이드 댓글 0개

통계에서는 일원 분산 분석(one-way ANOVA)을 사용하여 3개 이상의 독립 그룹의 평균을 비교하여 해당 모집단의 평균 간에 통계적으로 유의한 차이가 있는지 확인합니다.

일원 분산 분석을 수행할 때마다 항상 세 가지 제곱합 값을 계산합니다.

1. 제곱합 회귀(SSR)

각 그룹의 평균과 전체 평균 의 차이를 제곱한 값의 합입니다.

2. 제곱합 오류(SSE)

이는 각 개별 관측치와 해당 관측치의 그룹 평균 간의 차이를 제곱한 값의 합입니다.

3. 총 제곱합(SST)

이는 각 개별 관측치와 전체 평균 간의 차이를 제곱한 값의 합입니다.

이 세 가지 값 각각은 최종 ANOVA 테이블에 배치되며, 이를 사용하여 그룹 평균 간에 통계적으로 유의미한 차이가 있는지 여부를 결정합니다.

다음 예에서는 실제로 일원 분산 분석에 대한 이러한 각 제곱합 값을 계산하는 방법을 보여줍니다.

예: ANOVA에서 제곱합을 계산하는 방법

세 가지 서로 다른 시험 준비 프로그램이 특정 시험에서 서로 다른 평균 점수를 가져오는지 여부를 알고 싶다고 가정해 보겠습니다. 이를 테스트하기 위해 우리는 연구에 참여할 학생 30명을 모집하고 그들을 세 그룹으로 나눕니다.

각 그룹의 학생들은 시험 준비를 위해 다음 3주 동안 세 가지 시험 준비 프로그램 중 하나를 사용하도록 무작위로 배정됩니다. 3주 후에는 모든 학생들이 동일한 시험을 치릅니다.

각 그룹의 시험 결과는 다음과 같습니다.

일원 분산 분석 데이터의 예

다음 단계에서는 이 일원 분산 분석에 대한 제곱 값의 합을 계산하는 방법을 보여줍니다.

1단계: 그룹 평균과 전체 평균을 계산합니다.

먼저 세 그룹의 평균과 전체(또는 “전체”) 평균을 계산합니다.

2단계: SSR을 계산합니다.

다음으로, 다음 공식을 사용하여 SSR(제곱합 회귀)을 계산합니다.

nΣ(X _j – X ..) ²

금:

n : 그룹 j의 표본 크기
Σ : “합계”를 의미하는 그리스 기호
X _j : 그룹 j의 평균
X .. : 전체 평균

이 예에서는 SSR = 10(83.4-85.8) ² + 10(89.3-85.8) ² + 10(84.7-85.8) ² = 192.2 로 계산됩니다.

3단계: SES를 계산합니다.

다음으로, 다음 공식을 사용하여 SSE(제곱합 오류)를 계산합니다.

Σ( _Xij – Xj ₎ ²

금:

Σ : “합계”를 의미하는 그리스 기호
X _ij : 그룹 j의 ^i번째 관측치
X _j : 그룹 j의 평균

이 예에서는 SSE를 다음과 같이 계산합니다.

그룹 1: (85-83.4) ² + (86-83.4) ² + (88-83.4) ² + (75-83.4) ² + (78-83.4) ² + (94-83.4) ² + (98-83.4) ² + (79-83.4) ² + (71-83.4) ² + (80-83.4) ² = 640.4

그룹 2: (91-89.3) ² + (92-89.3) ² + (93-89.3) ² + (85-89.3) ² + (87-89.3) ² + (84-89.3) ² + (82-89.3) ² + (88-89.3) ² + (95-89.3) ² + (96-89.3) ² = 208.1

그룹 3: (79-84.7) ² + (78-84.7) ² + (88-84.7) ² + (94-84.7) ² + (92-84.7) ² + (85-84.7) ² + (83-84.7) ² + (85-84.7) ² + (82-84.7) ² + (81-84.7) ² = 252.1

ESS: 640.4 + 208.1 + 252.1 = 1,100.6

4단계: SST를 계산합니다.

다음으로, 다음 공식을 사용하여 총 제곱합(SST)을 계산합니다.

SST = SSR + SSE

이 예에서는 SST = 192.2 + 1100.6 = 1292.8

SSR, SSE 및 SST 값을 계산하면 이러한 각 값이 최종적으로 ANOVA 테이블에 배치됩니다.

원천	제곱합(SS)	df	평균 제곱(MS)	F값	p-값
회귀	192.2	2	96.1	2,358	0.1138
오류	1100.6	27	40.8
총	1292.8	29

다음은 표의 다양한 숫자를 계산하는 방법입니다.

회귀 df: k-1 = 3-1 = 2
오류 df: nk = 30-3 = 27
총 df: n-1 = 30-1 = 29
SEP 처리: SST 처리/df = 192.2 / 2 = 96.1
MS 오류: SSE 오류 / df = 1100.6 / 27 = 40.8
F 값: MS 처리 / MS 오류 = 96.1 / 40.8 = 2.358
p-값 : F 값에 해당하는 p-값입니다.

참고: n = 총 관측치 수, k = 그룹 수

ANOVA 테이블에서 F 값과 p 값을 해석하는 방법을 알아보려면 이 튜토리얼을 확인하세요.

저자 소개

벤자민 앤더슨

안녕하세요. 저는 통계학 교수를 퇴직하고 전임 통계 교사로 변신한 벤자민입니다. 통계 분야의 광범위한 경험과 전문 지식을 바탕으로 Statorials를 통해 학생들에게 힘을 실어주기 위해 지식을 공유하고 싶습니다. 더 알아보기

예: ANOVA에서 제곱합을 계산하는 방법

저자 소개

벤자민 앤더슨

의견을 추가하다