분산분석표

이번 포스팅에서는 ANOVA 테이블에 대한 설명을 살펴보겠습니다. 그래서 우리는 ANOVA 테이블이 무엇인지, ANOVA 테이블을 만드는 방법, ANOVA 테이블의 공식은 무엇인지 설명하고, 또한 단계별로 해결되는 연습을 볼 수 있습니다.

분산분석표란 무엇입니까?

ANOVA 테이블은 분산 분석에서 통계에 사용되는 테이블입니다. 보다 구체적으로 ANOVA 테이블에는 분산 분석에 필요한 모든 정보가 포함되어 있습니다.

따라서 ANOVA 테이블은 분산 분석을 요약하는 데 사용됩니다. 분산 분석 계산을 표에 표시하면 쉽게 결론을 도출할 수 있고 ANOVA 테스트 통계 값을 빠르게 계산할 수도 있습니다.

ANOVA 테이블 수식

일원 분산 분석 테이블에는 요인, 오류 및 합계의 세 가지 행이 있습니다. 따라서 ANOVA 테이블에서는 각 행의 제곱합과 자유도가 계산됩니다. 또한, 요인과 오차의 평균 제곱 오차를 계산하고 최종적으로 제곱 오차의 비율과 동일한 ANOVA 검정 통계량을 결정합니다.

따라서 ANOVA 테이블의 공식은 다음과 같습니다.

ANOVA 테이블 수식

금:

  • n_i

    표본 크기는 i입니다.

  • N

    총 관측치 수입니다.

  • k

    분산 분석에서 서로 다른 그룹의 수입니다.

  • y_{ij}

    는 그룹 i의 j 값입니다.

  • \overline{y}_{i}

    그룹 i의 평균입니다.

  • \overline{y}

    이는 분석된 모든 데이터의 평균입니다.

ANOVA 테이블의 예

개념을 잘 이해하기 위해 예제를 단계별로 풀어 ANOVA 테이블을 생성하는 방법을 살펴보겠습니다.

  • 세 가지 다른 과목(A, B, C)에서 4명의 학생이 얻은 점수를 비교하기 위한 통계 연구가 수행됩니다. 다음 표에는 최대 점수가 20점인 시험에서 각 학생이 얻은 점수가 자세히 나와 있습니다. 각 과목에서 각 학생이 얻은 점수를 비교하려면 분산 분석 테이블을 구성하십시오.

가장 먼저 해야 할 일은 각 주제의 평균과 데이터의 전체 평균을 계산하는 것입니다.

\overline{y}_A=\cfrac{14+12+14+10}{4}=12,5

\overline{y}_B=\cfrac{13+14+10+14}{4}=12,75

\overline{y}_C=\cfrac{19+17+16+19}{4}=17,75

\overline{y}=\cfrac{14+12+14+10+13+14+10+14+19+17+16+19}{12}=14,33

평균값을 알고 나면 분산분석표(위 참조)의 공식을 사용하여 제곱합을 계산합니다.

\begin{aligned}\displaystyle SS_F&=\sum_{i=1}^k n_i(\overline{y}_i-\overline{y})^2\\[2ex] SS_F&= 4\cdot (12,5-14,33)^2+4\cdot (12,75-14,33)^2+4\cdot (17,75-14,33)^2\\[2ex] SS_F&=70,17\end{aligned}

\begin{aligned}\displaystyle SS_E=&\sum_{i=1}^k\sum_{j=1}^{n_i} (y_{ij}-\overline{y}_i)^2\\[2ex] \displaystyle SS_E=\ &(14-12,5)^2+(12-12,5)^2+(14-12,5)^2+(10-12,5)^2+\\&+(13-12,75)^2+(14-12,75)^2+(10-12,75)^2+(14-12,75)^2+\\&+(19-17,75)^2+(17-17,75)^2+(16-17,75)^2+(19-17,75)^2\\[2ex] SS_E=\ &28,50\end{aligned}

\begin{aligned}\displaystyle SS_T=&\sum_{i=1}^k\sum_{j=1}^{n_i} (y_{ij}-\overline{y})^2\\[2ex] \displaystyle SS_T= \ &(14-14,33)^2+(12-14,33)^2+(14-14,33)^2+(10-14,33)^2+\\&+(13-14,33)^2+(14-14,33)^2+(10-14,33)^2+(14-14,33)^2+\\&+(19-14,33)^2+(17-14,33)^2+(16-14,33)^2+(19-14,33)^2\\[2ex] SS_T= \ &98,67\end{aligned}

그런 다음 요인, 오류 및 합계의 자유도를 결정합니다.

GL_F=k-1=3-1=2

GL_E=N-k=12-3=9

GL_F=N-1=12-1=11

이제 요인과 오류의 제곱의 합을 각각의 자유도로 나누어 평균 제곱 오류를 계산합니다.

MSE_F=\cfrac{SS_F}{GL_F}=\cfrac{70,17}{2}=35,08

MSE_R=\cfrac{SS_R}{GL_R}=\cfrac{28,50}{9}=3,17

마지막으로 이전 단계에서 계산된 두 오류를 나누어 F 통계 값을 계산합니다.

F=\cfrac{MSE_F}{MSE_R}=\cfrac{35,09}{3,17}=11,08

즉, 예제 데이터에 대한 ANOVA 테이블은 다음과 같습니다.

ANOVA 테이블의 예

ANOVA 테이블의 모든 값을 계산하고 나면 이를 해석하는 일만 남습니다. 이를 위해서는 p-값이라고 불리는 F 통계값에 해당하는 확률을 비교해야 합니다. 다음 링크를 클릭하면 이 작업이 어떻게 수행되는지 확인할 수 있습니다.

참조: p-값 해석

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다