Anova의 그룹 내 또는 그룹 간 변동
일원 분산 분석은 3개 이상의 독립 그룹의 평균이 동일한지 여부를 확인하는 데 사용됩니다.
일원 분산 분석에서는 다음과 같은 귀무 가설과 대립 가설을 사용합니다.
- H 0 : 모든 그룹 평균이 동일합니다.
- H A : 적어도 한 그룹의 평균은 다른 그룹의 평균과 다릅니다.
일원 분산 분석을 수행할 때마다 다음과 같은 요약 테이블이 생성됩니다.

ANOVA가 측정하는 두 가지 서로 다른 변동 소스가 있음을 알 수 있습니다.
그룹 간 변동 : 각 그룹의 평균과 전체 평균 간의 총 변동입니다.
그룹 내 변동 : 각 그룹의 개별 값의 전체 변동과 해당 그룹 평균입니다.
그룹 간 변동이 그룹 내 변동에 비해 높으면 ANOVA의 F 통계량은 더 높아지고 해당 p-값은 낮아져 귀무 가설이 기각될 가능성이 높아집니다. 그룹 평균이 동일합니다.
다음 예에서는 실제로 일원 분산 분석에 대한 그룹 간 변동과 그룹 내 변동을 계산하는 방법을 보여줍니다.
예: ANOVA에서 그룹 내 및 그룹 간 변동 계산
세 가지 다른 학습 방법으로 인해 평균 시험 점수가 달라지는지 여부를 확인한다고 가정해 보겠습니다. 이를 테스트하기 위해 우리는 30명의 학생을 모집하고 각기 다른 학습 방법을 사용하도록 무작위로 10명을 할당합니다 .
각 그룹 학생들의 시험 결과는 다음과 같습니다.

다음 공식을 사용하여 그룹 간의 변동을 계산할 수 있습니다.
그룹 간 변동 = Σn j (X j – X ..) 2
금:
- n j : 그룹 j의 표본 크기
- Σ : 합계를 의미하는 기호
- X j : 그룹 j의 평균
- X .. : 전체 평균
이 값을 계산하기 위해 먼저 각 그룹의 평균과 전체 평균을 계산합니다.

그런 다음 그룹 간 변동을 다음과 같이 계산합니다: 10(80.5-83.1) 2 + 10(82.1-83.1) 2 + 10(86.7-83.1) 2 = 207.2 .
그런 다음 다음 공식을 사용하여 그룹 내 변동을 계산할 수 있습니다.
그룹 내 변동 : Σ(X ij – X j ) 2
금:
- Σ : 합계를 의미하는 기호
- X ij : 그룹 j의 i번째 관측치
- X j : 그룹 j의 평균
이 예에서는 그룹 내 변동을 다음과 같이 계산합니다.
그룹 1: (75-80.5) 2 + (77-80.5) 2 + (78-80.5) 2 + (78-80.5) 2 + (79-80.5) 2 + (81-80.5) 2 + (81-80.5) 2 + (83-80.5) 2 + (86-80.5) 2 + (87-80.5) 2 = 136.5
그룹 2: (78-82.1) 2 + (78-82.1) 2 + (79-82.1) 2 + (81-82.1) 2 + (81-82.1) 2 + (82-82.1) 2 + (83-82.1) 2 + (85-82.1) 2 + (86-82.1) 2 + (88-82.1) 2 = 104.9
그룹 3: (82-86.7) 2 + (82-86.7) 2 + (84-86.7) 2 + (86-86.7) 2 + (86-86.7) 2 + (87-86.7) 2 + (87-86.7) 2 + (89-86.7) 2 + (90-86.7) 2 + (94-86.7) 2 = 122.1
그룹 내 변동: 136.5 + 104.9 + 122.1 = 363.5
통계 소프트웨어를 사용하여 이 데이터 세트를 사용하여 일원 분산 분석을 수행하면 다음 분산 분석 테이블을 얻게 됩니다.

그룹 간 및 그룹 내 변동 값은 수동으로 계산한 값과 일치합니다.
표의 전체 F 통계량은 그룹 간 변동과 그룹 내 변동 간의 관계를 수량화하는 방법입니다.
F 통계량이 클수록 그룹 내 변동에 비해 그룹 간의 변동이 더 커집니다.
따라서 F 통계량이 클수록 그룹 평균 간에 차이가 있다는 것이 더 분명해집니다.
이 예에서는 F-통계량 7.6952에 해당하는 p-값이 .0023 임을 알 수 있습니다.
이 값은 α = 0.05보다 작기 때문에 ANOVA의 귀무가설을 기각하고 세 가지 학습 기법이 시험에서 동일한 점수로 이어지지 않는다는 결론을 내립니다.
추가 리소스
다음 자습서에서는 분산 분석 모델에 대한 추가 정보를 제공합니다.