Jak interpretować pr(>|t|) w wynikach modelu regresji w r


Za każdym razem, gdy wykonasz regresję liniową w R, dane wyjściowe modelu regresji zostaną wyświetlone w następującym formacie:

 Coefficients:
            Estimate Std. Error t value Pr(>|t|)  
(Intercept) 10.0035 5.9091 1.693 0.1513  
x1 1.4758 0.5029 2.935 0.0325 *
x2 -0.7834 0.8014 -0.978 0.3732 

Kolumna Pr(>|t|) reprezentuje wartość p powiązaną z wartością w kolumnie wartość t .

Jeśli wartość p jest poniżej pewnego poziomu istotności (np. α = 0,05), wówczas uważa się, że zmienna predykcyjna ma statystycznie istotny związek ze zmienną odpowiedzi w modelu.

Poniższy przykład pokazuje jak interpretować wartości w kolumnie Pr(>|t|) dla danego modelu regresji.

Przykład: Jak interpretować wartości Pr(>|t|).

Załóżmy, że chcemy dopasować model regresji liniowej wielokrotnej , używając zmiennych predykcyjnych x1 i x2 oraz pojedynczej zmiennej odpowiedzi y .

Poniższy kod pokazuje, jak utworzyć ramkę danych i dopasować model regresji do danych:

 #create data frame
df <- data. frame (x1=c(1, 3, 3, 4, 4, 5, 6, 6),
                 x2=c(7, 7, 5, 6, 5, 4, 5, 6),
                 y=c(8, 8, 9, 9, 13, 14, 17, 14))

#fit multiple linear regression model
model <- lm(y ~ x1 + x2, data=df)

#view model summary
summary(model)

Call:
lm(formula = y ~ x1 + x2, data = df)

Residuals:
      1 2 3 4 5 6 7 8 
 2.0046 -0.9470 -1.5138 -2.2062 1.0104 -0.2488 2.0588 -0.1578 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)  
(Intercept) 10.0035 5.9091 1.693 0.1513  
x1 1.4758 0.5029 2.935 0.0325 *
x2 -0.7834 0.8014 -0.978 0.3732  
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 1.867 on 5 degrees of freedom
Multiple R-squared: 0.7876, Adjusted R-squared: 0.7026 
F-statistic: 9.268 on 2 and 5 DF, p-value: 0.0208

Oto jak interpretować wartości w kolumnie Pr(>|t|):

  • Wartość p dla zmiennej predykcyjnej x1 wynosi 0,0325 . Ponieważ wartość ta jest mniejsza niż 0,05, istnieje statystycznie istotna zależność ze zmienną odpowiedzi w modelu.
  • Wartość p dla zmiennej predykcyjnej x2 wynosi 0,3732 . Ponieważ wartość ta jest nie mniejsza niż 0,05, nie ma ona istotnego statystycznie związku ze zmienną odpowiedzi w modelu.

Kody istotności poniżej tabeli współczynników mówią nam, że pojedyncza gwiazdka (*) obok wartości p wynoszącej 0,0325 oznacza, że wartość p jest statystycznie istotna przy α = 0,05.

Jak faktycznie oblicza się Pr(>|t|)?

Oto jak faktycznie obliczana jest wartość Pr(>|t|):

Krok 1: Oblicz wartość t

Najpierw obliczamy wartość t za pomocą następującego wzoru:

  • Wartość t = szacunkowa / standardowa Błąd

Na przykład, oto jak obliczyć wartość t dla zmiennej predykcyjnej x1:

 #calculate t-value
1.4758 / .5029

[1] 2.934579

Krok 2: Oblicz wartość p

Następnie obliczamy wartość p. Oznacza to prawdopodobieństwo, że wartość bezwzględna rozkładu t jest większa niż 2,935.

Aby obliczyć tę wartość, możemy użyć następującego wzoru w R:

  • wartość p = 2 * pt (abs (wartość t), resztkowa df, dolny ogon = FAŁSZ)

Na przykład, oto jak obliczyć wartość p dla wartości t wynoszącej 2,935 z 5 resztkowymi stopniami swobody:

 #calculate p-value
2 * pt( abs (2.935), 5, lower. tail = FALSE )

[1] 0.0324441

Należy zauważyć, że ta wartość p odpowiada wartości p z powyższego wyniku regresji.

Uwaga: Wartość pozostałych stopni swobody znajduje się na dole wyniku regresji. W naszym przykładzie okazało się, że jest to 5:

 Residual standard error: 1.867 on 5 degrees of freedom

Dodatkowe zasoby

Jak wykonać prostą regresję liniową w R
Jak wykonać wielokrotną regresję liniową w R
Jak wykreślić wyniki wielokrotnej regresji liniowej w R

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *