Jak interpretować pr(>|z|) w wynikach regresji logistycznej w r


Za każdym razem, gdy przeprowadzasz regresję logistyczną w R, dane wyjściowe modelu regresji zostaną wyświetlone w następującym formacie:

 Coefficients:
              Estimate Std. Error z value Pr(>|z|)  
(Intercept) -17.638452 9.165482 -1.924 0.0543 .
available -0.004153 0.006621 -0.627 0.5305  
drat 4.879396 2.268115 2.151 0.0315 * 

Kolumna Pr(>|z|) reprezentuje wartość p powiązaną z wartością w kolumnie wartość z .

Jeśli wartość p jest poniżej pewnego poziomu istotności (np. α = 0,05), oznacza to, że zmienna predykcyjna ma statystycznie istotny związek zezmienną odpowiedzi w modelu.

Poniższy przykład pokazuje jak w praktyce interpretować wartości kolumny Pr(>|z|) dla modelu regresji logistycznej.

Przykład: Jak interpretować wartości Pr(>|z|).

Poniższy kod pokazuje, jak dopasować model regresji logistycznej w R przy użyciu wbudowanego zbioru danych mtcars :

 #fit logistic regression model
model <- glm(am ~ disp + drat, data=mtcars, family=binomial)

#view model summary
summary(model)

Call:
glm(formula = am ~ disp + drat, family = binomial, data = mtcars)

Deviance Residuals: 
    Min 1Q Median 3Q Max  
-1.5773 -0.2273 -0.1155 0.5196 1.8957  

Coefficients:
              Estimate Std. Error z value Pr(>|z|)  
(Intercept) -17.638452 9.165482 -1.924 0.0543 .
available -0.004153 0.006621 -0.627 0.5305  
drat 4.879396 2.268115 2.151 0.0315 *
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 43,230 on 31 degrees of freedom
Residual deviance: 21,268 on 29 degrees of freedom
AIC: 27,268

Number of Fisher Scoring iterations: 6

Oto jak interpretować wartości w kolumnie Pr(>|z|):

  • Wartość p dla zmiennej predykcyjnej „disp” wynosi 0,5305 . Ponieważ wartość ta jest nie mniejsza niż 0,05, nie ma ona istotnego statystycznie związku ze zmienną odpowiedzi w modelu.
  • Wartość p dla zmiennej predykcyjnej „drat” wynosi 0,0315 . Ponieważ wartość ta jest mniejsza niż 0,05, istnieje statystycznie istotna zależność ze zmienną odpowiedzi w modelu.

Kody istotności poniżej tabeli współczynników mówią nam, że pojedyncza gwiazdka (*) obok wartości p wynoszącej 0,0315 oznacza, że wartość p jest statystycznie istotna przy α = 0,05.

Jak oblicza się Pr(>|z|)?

Oto jak faktycznie obliczana jest wartość Pr(>|z|):

Krok 1: Oblicz wartość z

Najpierw obliczamy wartość z za pomocą następującego wzoru:

  • wartość z = szacunkowa / standardowa Błąd

Na przykład, oto jak obliczyć wartość z dla zmiennej predykcyjnej „drat”:

 #calculate z-value
4.879396 / 2.268115

[1] 2.151

Krok 2: Oblicz wartość p

Następnie obliczamy dwustronną wartość p. Oznacza to prawdopodobieństwo, że wartość bezwzględna rozkładu normalnego jest większa niż 2,151 lub mniejsza niż -2,151.

Aby obliczyć tę wartość, możemy użyć następującego wzoru w R:

  • wartość p = 2 * (1-pnorm(wartość-z))

Na przykład, oto jak obliczyć dwustronną wartość p dla wartości z wynoszącej 2,151:

 #calculate p-value
2*(1-pnorm(2.151))

[1] 0.0314762

Należy zauważyć, że ta wartość p jest zgodna z wartością p z powyższego wyniku regresji.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak dopasować różne modele regresji w R:

Jak przeprowadzić regresję logistyczną w R
Jak wykonać prostą regresję liniową w R
Jak wykonać wielokrotną regresję liniową w R

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *