วิธีใช้ฟังก์ชัน coeftest() ใน r
คุณสามารถใช้ฟังก์ชัน coeftest() จากแพ็คเกจ lmtest ใน R เพื่อทำการทดสอบทีสำหรับค่าสัมประสิทธิ์โดยประมาณแต่ละตัวในแบบจำลองการถดถอย
ฟังก์ชันนี้ใช้ไวยากรณ์พื้นฐานต่อไปนี้:
ค่าร่วมสูงสุด(x)
ทอง:
- x : ชื่อของแบบจำลองการถดถอยที่ติดตั้ง
ตัวอย่างต่อไปนี้แสดงวิธีใช้ฟังก์ชันนี้ในทางปฏิบัติ
ตัวอย่าง: วิธีใช้ฟังก์ชัน coeftest() ใน R
สมมติว่าเรามีกรอบข้อมูลต่อไปนี้ใน R ที่แสดงจำนวนชั่วโมงที่ใช้ในการเรียน จำนวนข้อสอบฝึกหัดที่สอบ และคะแนนสอบปลายภาคของนักเรียน 10 คนในชั้นเรียน:
#create data frame df <- data. frame (score=c(77, 79, 84, 85, 88, 99, 95, 90, 92, 94), hours=c(1, 1, 2, 3, 2, 4, 4, 2, 3, 3), prac_exams=c(2, 3, 3, 2, 4, 5, 4, 3, 5, 4)) #view data frame df score hours prac_exams 1 77 1 2 2 79 1 3 3 84 2 3 4 85 3 2 5 88 2 4 6 99 4 5 7 95 4 4 8 90 2 3 9 92 3 5 10 94 3 4
ตอนนี้ สมมติว่าเราต้องการปรับโมเดลการถดถอยเชิงเส้นพหุคูณต่อไปนี้ใน R:
คะแนนสอบ = β 0 + β 1 (ชั่วโมง) + β 2 (ข้อสอบภาคปฏิบัติ)
เราสามารถใช้ฟังก์ชัน lm() เพื่อปรับเปลี่ยนโมเดลนี้ได้:
#fit multiple linear regression model
fit <- lm(score ~ hours + prac_exams, data=df)
จากนั้นเราสามารถใช้ฟังก์ชัน coeftest() เพื่อทำการทดสอบ t สำหรับค่าสัมประสิทธิ์การถดถอยที่ติดตั้งไว้แต่ละตัวในโมเดล:
library (lmtest)
#perform t-test for each coefficient in model
coeftest(fit)
t test of coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 68.40294 2.87227 23.8150 5.851e-08 ***
hours 4.19118 0.99612 4.2075 0.003998 **
prac_exams 2.69118 0.99612 2.7017 0.030566 *
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
สถิติการทดสอบทีและค่า p ที่สอดคล้องกันจะแสดงขึ้นสำหรับการทดสอบแต่ละครั้ง:
- ค่าตัดแกน : t = 23.8150, p = <0.000
- ชั่วโมง : t = 4.2075, p = 0.003998
- prac_exams : t = 2.7017, p = 0.030566
โปรดทราบว่าเราใช้สมมติฐานว่างและทางเลือกต่อไปนี้สำหรับการทดสอบแต่ละครั้ง:
- H 0 : β i = 0 (ความชันเท่ากับศูนย์)
- HA : β i ≠ 0 (ความชันไม่เท่ากับศูนย์)
หากค่า p ของการทดสอบทีต่ำกว่าเกณฑ์ที่กำหนด (เช่น α = 0.05) เราจะปฏิเสธสมมติฐานว่างและสรุปว่ามีความสัมพันธ์ที่มีนัยสำคัญทางสถิติระหว่างตัวแปรทำนายและตัวแปรตอบสนอง
เนื่องจากค่า p สำหรับการทดสอบแต่ละครั้งมีค่าน้อยกว่า 0.05 เราจะสรุปได้ว่าตัวแปรทำนายแต่ละตัวในแบบจำลองมีความสัมพันธ์ที่มีนัยสำคัญทางสถิติกับตัวแปรตอบสนอง
ในบริบทของตัวอย่างนี้ เราจะบอกว่าชั่วโมงที่ใช้ในการศึกษาและจำนวนข้อสอบฝึกหัดที่สอบ ล้วนเป็นตัวทำนายผลสอบปลายภาคที่มีนัยสำคัญทางสถิติของนักเรียน
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้ให้ข้อมูลเพิ่มเติมเกี่ยวกับการถดถอยเชิงเส้นใน R:
วิธีการตีความเอาต์พุตการถดถอยใน R
วิธีดำเนินการถดถอยเชิงเส้นอย่างง่ายใน R
วิธีดำเนินการถดถอยเชิงเส้นพหุคูณใน R
วิธีดำเนินการถดถอยโลจิสติกใน R