R에서 에타 제곱을 계산하는 방법
에타 제곱은 ANOVA 모델에서 일반적으로 사용되는 효과 크기 의 척도입니다.
분산 분석 모델의 각 주 효과 및 상호 작용 효과와 관련된 분산 비율을 측정하고 다음과 같이 계산됩니다.
에타 제곱 = SS 효과 / 총 SS
금:
- SS 효과 : 변수에 대한 효과 제곱의 합입니다.
- 총 SS: 분산 분석 모델의 총 제곱합입니다.
에타 제곱 값의 범위는 0에서 1까지이며, 값이 1에 가까울수록 모델의 특정 변수로 설명할 수 있는 분산의 비율이 더 높다는 것을 나타냅니다.
에타 제곱 값을 해석하는 데는 다음과 같은 경험 법칙이 사용됩니다.
- .01: 작은 효과 크기
- .06: 평균 효과 크기
- .14 이상: 효과 크기가 큼
이 튜토리얼에서는 R의 ANOVA 모델에서 변수에 대한 에타 제곱을 계산하는 방법에 대한 단계별 예를 제공합니다.
1단계: 데이터 생성
운동 강도와 성별이 체중 감량에 영향을 미치는지 확인하고 싶다고 가정해 보겠습니다.
이를 테스트하기 위해 우리는 남성 30명과 여성 30명을 모집하여 한 달 동안 운동하지 않거나 가벼운 운동 또는 강렬한 운동 프로그램을 따르도록 각 10명을 무작위로 할당하는 실험에 참여했습니다.
다음 코드는 작업 중인 데이터를 보관할 데이터 프레임을 만드는 방법을 보여줍니다.
#make this example reproducible set.seed(10) #create data frame data <- data.frame(gender= rep (c(" Male ", " Female "), each = 30), exercise= rep (c(" None ", " Light ", "Intense"), each = 10, times =2), weight_loss=c(runif(10, -3, 3), runif(10, 0, 5), runif(10, 5, 9), runif(10, -4, 2), runif(10, 0, 3), runif(10, 3, 8))) #view first six rows of data frame head(data) # gender exercise weight_loss #1 Male None 0.04486922 #2 Male None -1.15938896 #3 Male None -0.43855400 #4 Male None 1.15861249 #5 Male None -2.48918419 #6 Male None -1.64738030 #see how many participants are in each group table(data$gender, data$exercise) # Intense Light None # Female 10 10 10 # Male 10 10 10
2단계: 분산 분석 모델 적합
다음 코드는 운동과 성별을 요인으로 사용하고 체중 감량을 반응 변수 로 사용하여 양방향 ANOVA를 피팅하는 방법을 보여줍니다.
#fit the two-way ANOVA model model <- aov(weight_loss ~ gender + exercise, data = data) #view the model output summary(model) Df Sum Sq Mean Sq F value Pr(>F) gender 1 15.8 15.80 9.916 0.00263 ** exercise 2 505.6 252.78 158.610 < 2nd-16 *** Residuals 56 89.2 1.59
3단계: 에타 제곱 계산
lsr 패키지의 etaSquared() 함수를 사용하여 모델의 각 변수에 대한 에타 제곱 효과 크기를 계산할 수 있습니다.
#load lsr package library (lsr) #calculate Eta Squared etaSquared(model) eta.sq eta.sq.part gender 0.0258824 0.1504401 exercise 0.8279555 0.8499543
섹스와 운동에 대한 에타 제곱은 다음과 같습니다.
- 성별에 대한 에타 제곱: 0.0258824
- 운동에 대한 에타 제곱: 0.8279555
우리는 운동에 대한 효과 크기가 매우 큰 반면 성별에 대한 효과 크기는 매우 작다는 결론을 내릴 수 있습니다.
이 결과는 ANOVA 테이블 결과에 표시된 p 값에 해당합니다. 운동에 대한 p-값(<0.000)은 성별에 대한 p-값(0.00263)보다 훨씬 작으며, 이는 운동이 체중 감량 예측에 훨씬 더 중요함을 나타냅니다.
추가 리소스
다음 튜토리얼에서는 R에서 다양한 ANOVA 모델을 맞추는 방법을 설명합니다.
R에서 일원 분산 분석을 수행하는 방법
R에서 양방향 ANOVA를 수행하는 방법
R에서 반복 측정 ANOVA를 수행하는 방법