전체 가이드: sas에서 anova 결과를 해석하는 방법


일원 분산 분석은 3개 이상의 독립 그룹 평균 간에 통계적으로 유의한 차이가 있는지 여부를 확인하는 데 사용됩니다.

다음 예에서는 SAS에서 일원 분산 분석의 결과를 해석하는 방법을 보여줍니다.

예: SAS에서 ANOVA 결과 해석

한 연구자가 연구에 참여할 학생 30명을 모집한다고 가정해 보겠습니다. 학생들은 시험 준비를 위해 세 가지 학습 방법 중 하나를 사용하도록 무작위로 배정 됩니다.

각 학생의 시험 결과는 다음과 같습니다.

다음 코드를 사용하여 SAS에서 이 데이터 세트를 생성할 수 있습니다.

 /*create dataset*/
data my_data;
    input Method $Score;
    datalines ;
At 78
At 81
At 82
At 82
At 85
At 88
At 88
At 90
B 81
B 83
B 83
B85
B 86
B 88
B90
B91
C 84
C 88
C 88
C 89
C 90
C 93
C 95
C 98
;
run ;

다음으로 proc ANOVA를 사용하여 일원 분산 분석을 수행합니다.

 /*perform one-way ANOVA*/
proc ANOVA data =my_data;
    classMethod ;
    modelScore = Method;
    means Method / tukey cldiff ;
run ;

참고 : 일원 분산 분석의 전체 p-값이 통계적으로 유의한 경우 Tukey 사후 테스트를 신뢰 구간과 함께 수행해야 함을 지정하기 위해 tukeycldiff 옵션과 함께 평균 설명을 사용했습니다.

먼저 결과에서 ANOVA 테이블을 살펴보겠습니다.

SAS의 일원 분산 분석

출력의 각 값을 해석하는 방법은 다음과 같습니다.

DF 모델: 변수 방법 의 자유도입니다. 이는 #groups -1로 계산됩니다. 이 경우에는 3가지 연구 방법이 있으므로 이 값은 3-1 = 2 입니다.

DF 오류: 잔차의 자유도입니다. 이는 #총 관측치 – #그룹으로 계산됩니다. 이 경우에는 24개의 관측치와 3개의 그룹이 있으므로 이 값은 24-3 = 21 입니다.

수정된 합계 : DF 모델과 DF 오류의 합계입니다. 이 값은 2 + 21 = 23 입니다.

제곱합 모델: 변수 방법 과 관련된 제곱합입니다. 이 값은 175.583 입니다.

제곱합 오류: 잔차 또는 “오차”와 관련된 제곱합입니다. 이 값은 350.25 입니다.

수정된 제곱합 합계 : SS 모델과 SS 오류의 합입니다. 이 값은 525.833 입니다.

평균 제곱 모델: 방법 과 관련된 평균 제곱합입니다. 이는 SS 모델/DF 모델, 즉 175.583/2 = 87.79 로 계산됩니다.

평균 제곱 오차: 잔차와 관련된 평균 제곱합입니다. 이는 SS 오류 / DF 오류로 계산되며, 이는 350.25 / 21 = 16.68 입니다.

F 값: ANOVA 모델의 전체 F 통계입니다. 이는 모델 평균 제곱/평균 제곱 오차, 즉 87.79/16.68 = 5.26 으로 계산됩니다.

Pr >F: 분자 df = 2, 분모 df = 21인 F 통계와 연관된 p-값. 이 경우 p-값은 0.0140 입니다.

결과 세트에서 가장 중요한 값은 p-값인데, 이는 세 그룹 간의 평균값에 유의미한 차이가 있는지를 알려주기 때문입니다.

일원 분산 분석에서는 다음과 같은 귀무 가설과 대립 가설을 사용합니다.

  • H 0 (귀무 가설): 모든 그룹 평균이 동일합니다.
  • HA (대립가설): 적어도 하나의 그룹 평균이 다른 그룹 평균과 다릅니다.

ANOVA 테이블의 p-값(0.0140)이 0.05보다 작으므로 귀무 가설을 기각합니다.

이는 세 가지 학습 방법의 평균 시험 점수가 동일하지 않다고 말할 수 있는 충분한 증거가 있음을 의미합니다.

정확히 어떤 그룹 평균이 다른지 확인하려면 Tukey의 사후 테스트 결과를 보여주는 최종 결과 테이블을 참조해야 합니다.

SAS의 Tukey 테스트

어떤 그룹 평균이 다른지 확인하려면 옆에 별표( *** )가 있는 쌍별 비교를 살펴봐야 합니다.

표를 보면 그룹 A와 그룹 C의 평균 시험 점수에 통계적으로 유의미한 차이가 있음을 알 수 있습니다.

구체적으로 그룹 C와 그룹 A의 시험 점수 평균 차이는 6.375 입니다.

평균 차이에 대한 95% 신뢰구간은 [1.228, 11.522] 입니다.

다른 그룹의 평균 간에는 통계적으로 유의미한 차이가 없습니다.

추가 리소스

다음 자습서에서는 분산 분석 모델에 대한 추가 정보를 제공합니다.

ANOVA를 통한 사후 테스트 사용 가이드
SAS에서 일원 분산 분석을 수행하는 방법
SAS에서 양방향 ANOVA를 수행하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다