R의 의미 코드를 해석하는 방법


R에서 회귀 분석 이나 ANOVA를 수행하면 출력 테이블에는 해당 유의 코드 와 함께 분석에 사용된 변수에 대한 p 값이 포함됩니다.

변수가 통계적으로 유의미한 경우 이러한 유의성 코드는 일련의 별표 또는 소수점으로 표시됩니다.

다양한 의미 코드를 해석하는 방법은 다음과 같습니다.

 significance code p-value
   *** [0, 0.001]
    **(0.001, 0.01]
     * (0.01, 0.05]
     . (0.05, 0.1]
                         (0.1, 1]

다음 예는 실제로 이러한 의미 코드를 해석하는 방법을 보여줍니다.

예: 회귀 의미 코드

다음 코드는 예측 변수로 hp , dratwt 를 사용하고 응답 변수로 mpg 를 사용하여 통합 mtcars 데이터세트에 다중 선형 회귀 모델을 맞추는 방법을 보여줍니다.

 #fit regression model using hp, drat, and wt as predictors
model <- lm(mpg ~ hp + drat + wt, data = mtcars)

#view model summary
summary(model)

Call:
lm(formula = mpg ~ hp + drat + wt, data = mtcars)

Residuals:
    Min 1Q Median 3Q Max 
-3.3598 -1.8374 -0.5099 0.9681 5.7078 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 29.394934 6.156303 4.775 5.13e-05 ***
hp -0.032230 0.008925 -3.611 0.001178 ** 
drat 1.615049 1.226983 1.316 0.198755    
wt -3.227954 0.796398 -4.053 0.000364 ***
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 2.561 on 28 degrees of freedom
Multiple R-squared: 0.8369, Adjusted R-squared: 0.8194 
F-statistic: 47.88 on 3 and 28 DF, p-value: 3.768e-11

세 가지 예측 변수에 대한 유의성 코드를 해석하는 방법은 다음과 같습니다.

  • hp 의 p-값은 0.001178 입니다. 이 값은 (0.001, 0.01] 범위에 있으므로 ** 라는 의미의 코드를 갖습니다.
  • drat 의 p-값은 0.198755 입니다. 이 값은 (0,1, 1] 범위에 있으므로 의미가 없는 코드입니다.
  • wt 의 p-값은 .000364 입니다. 이 값은 [0, 0.001] 범위에 있으므로 *** 라는 의미 코드를 갖습니다.

이 회귀 모델에서 어떤 예측 변수가 유의미한지 결정하기 위해 α = 0.05의 알파 수준을 사용했다면 hpwt는 통계적으로 유의미한 예측 변수이고 drat 는 그렇지 않다고 말할 수 있습니다.

예: ANOVA의 유의성 코드

다음 코드는 gear를 요인 변수로 사용하고 mpg를 응답 변수로 사용하여 통합 mtcars 데이터세트에 일원 분산 분석 모델을 맞추는 방법을 보여줍니다.

 #fit one-way ANOVA
model <- aov(mpg ~ gear, data = mtcars)

#view the model output
summary(model)

            Df Sum Sq Mean Sq F value Pr(>F)   
gear 1 259.7 259.75 8.995 0.0054 **
Residuals 30 866.3 28.88                  
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

출력에서 의미 코드를 해석하는 방법은 다음과 같습니다.

  • 기어링 의 p-값은 0.0054 입니다. 이 값은 (0.001, 0.01] 범위에 있으므로 ** 라는 의미의 코드를 갖습니다.

α = 0.05의 알파 수준을 사용하면 기어링이 통계적으로 유의하다고 말할 수 있습니다. 즉, 장비 가치에 따른 자동차의 평균 mpg 사이에는 통계적으로 유의미한 차이가 있습니다.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다