Bagaimana menafsirkan pr(>|t|) dalam keluaran model regresi di r


Setiap kali Anda melakukan regresi linier di R, keluaran model regresi Anda akan ditampilkan dalam format berikut:

 Coefficients:
            Estimate Std. Error t value Pr(>|t|)  
(Intercept) 10.0035 5.9091 1.693 0.1513  
x1 1.4758 0.5029 2.935 0.0325 *
x2 -0.7834 0.8014 -0.978 0.3732 

Kolom Pr(>|t|) mewakili nilai p yang terkait dengan nilai pada kolom nilai t .

Jika p-value berada di bawah tingkat signifikansi tertentu (misalnya α = 0,05), maka variabel prediktor dianggap mempunyai hubungan yang signifikan secara statistik dengan variabel respon dalam model.

Contoh berikut menunjukkan cara menafsirkan nilai di kolom Pr(>|t|) untuk model regresi tertentu.

Contoh: Cara menginterpretasikan nilai Pr(>|t|).

Misalkan kita ingin menyesuaikan model regresi linier berganda menggunakan variabel prediktor x1 dan x2 serta variabel respons tunggal y .

Kode berikut menunjukkan cara membuat bingkai data dan menyesuaikan model regresi dengan data:

 #create data frame
df <- data. frame (x1=c(1, 3, 3, 4, 4, 5, 6, 6),
                 x2=c(7, 7, 5, 6, 5, 4, 5, 6),
                 y=c(8, 8, 9, 9, 13, 14, 17, 14))

#fit multiple linear regression model
model <- lm(y ~ x1 + x2, data=df)

#view model summary
summary(model)

Call:
lm(formula = y ~ x1 + x2, data = df)

Residuals:
      1 2 3 4 5 6 7 8 
 2.0046 -0.9470 -1.5138 -2.2062 1.0104 -0.2488 2.0588 -0.1578 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)  
(Intercept) 10.0035 5.9091 1.693 0.1513  
x1 1.4758 0.5029 2.935 0.0325 *
x2 -0.7834 0.8014 -0.978 0.3732  
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 1.867 on 5 degrees of freedom
Multiple R-squared: 0.7876, Adjusted R-squared: 0.7026 
F-statistic: 9.268 on 2 and 5 DF, p-value: 0.0208

Berikut cara menginterpretasikan nilai pada kolom Pr(>|t|):

  • Nilai p untuk variabel prediktor x1 adalah 0.0325 . Karena nilai ini kurang dari 0,05, maka terdapat hubungan yang signifikan secara statistik dengan variabel respon dalam model.
  • Nilai p untuk variabel prediktor x2 adalah 0.3732 . Karena nilai ini tidak kurang dari 0,05, maka tidak mempunyai hubungan yang signifikan secara statistik dengan variabel respon dalam model.

Kode signifikansi di bawah tabel koefisien menunjukkan bahwa satu tanda bintang (*) di sebelah nilai p sebesar 0,0325 berarti nilai p signifikan secara statistik pada α = 0,05.

Bagaimana sebenarnya Pr(>|t|) dihitung?

Berikut adalah cara sebenarnya menghitung nilai Pr(>|t|):

Langkah 1: Hitung nilai t

Pertama, kita hitung nilai t menggunakan rumus berikut:

  • nilai-t = Perkiraan / Std. Kesalahan

Sebagai contoh, berikut cara menghitung nilai t untuk variabel prediktor x1:

 #calculate t-value
1.4758 / .5029

[1] 2.934579

Langkah 2: Hitung nilai p

Selanjutnya, kita menghitung nilai p. Hal ini menunjukkan kemungkinan nilai absolut dari distribusi t lebih besar dari 2,935.

Kita dapat menggunakan rumus berikut di R untuk menghitung nilai ini:

  • p-value = 2 * pt (abs (t-value), sisa df, lower.tail = FALSE)

Sebagai contoh, berikut cara menghitung nilai p untuk nilai t 2,935 dengan 5 derajat kebebasan sisa:

 #calculate p-value
2 * pt( abs (2.935), 5, lower. tail = FALSE )

[1] 0.0324441

Perhatikan bahwa nilai p ini cocok dengan nilai p pada keluaran regresi di atas.

Catatan: Nilai derajat kebebasan sisa berada di bagian bawah keluaran regresi. Dalam contoh kita, hasilnya adalah 5:

 Residual standard error: 1.867 on 5 degrees of freedom

Sumber daya tambahan

Cara melakukan regresi linier sederhana di R
Cara melakukan regresi linier berganda di R
Cara memplot hasil regresi linier berganda di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *