วิธีใช้ฟังก์ชัน coeftest() ใน r


คุณสามารถใช้ฟังก์ชัน coeftest() จากแพ็คเกจ lmtest ใน R เพื่อทำการทดสอบทีสำหรับค่าสัมประสิทธิ์โดยประมาณแต่ละตัวในแบบจำลองการถดถอย

ฟังก์ชันนี้ใช้ไวยากรณ์พื้นฐานต่อไปนี้:

ค่าร่วมสูงสุด(x)

ทอง:

  • x : ชื่อของแบบจำลองการถดถอยที่ติดตั้ง

ตัวอย่างต่อไปนี้แสดงวิธีใช้ฟังก์ชันนี้ในทางปฏิบัติ

ตัวอย่าง: วิธีใช้ฟังก์ชัน coeftest() ใน R

สมมติว่าเรามีกรอบข้อมูลต่อไปนี้ใน R ที่แสดงจำนวนชั่วโมงที่ใช้ในการเรียน จำนวนข้อสอบฝึกหัดที่สอบ และคะแนนสอบปลายภาคของนักเรียน 10 คนในชั้นเรียน:

 #create data frame
df <- data. frame (score=c(77, 79, 84, 85, 88, 99, 95, 90, 92, 94),
                 hours=c(1, 1, 2, 3, 2, 4, 4, 2, 3, 3),
                 prac_exams=c(2, 3, 3, 2, 4, 5, 4, 3, 5, 4))

#view data frame
df

   score hours prac_exams
1 77 1 2
2 79 1 3
3 84 2 3
4 85 3 2
5 88 2 4
6 99 4 5
7 95 4 4
8 90 2 3
9 92 3 5
10 94 3 4

ตอนนี้ สมมติว่าเราต้องการปรับโมเดลการถดถอยเชิงเส้นพหุคูณต่อไปนี้ใน R:

คะแนนสอบ = β 0 + β 1 (ชั่วโมง) + β 2 (ข้อสอบภาคปฏิบัติ)

เราสามารถใช้ฟังก์ชัน lm() เพื่อปรับเปลี่ยนโมเดลนี้ได้:

 #fit multiple linear regression model
fit <- lm(score ~ hours + prac_exams, data=df)

จากนั้นเราสามารถใช้ฟังก์ชัน coeftest() เพื่อทำการทดสอบ t สำหรับค่าสัมประสิทธิ์การถดถอยที่ติดตั้งไว้แต่ละตัวในโมเดล:

 library (lmtest)

#perform t-test for each coefficient in model
coeftest(fit)

t test of coefficients:

            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 68.40294 2.87227 23.8150 5.851e-08 ***
hours 4.19118 0.99612 4.2075 0.003998 ** 
prac_exams 2.69118 0.99612 2.7017 0.030566 *  
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

สถิติการทดสอบทีและค่า p ที่สอดคล้องกันจะแสดงขึ้นสำหรับการทดสอบแต่ละครั้ง:

  • ค่าตัดแกน : t = 23.8150, p = <0.000
  • ชั่วโมง : t = 4.2075, p = 0.003998
  • prac_exams : t = 2.7017, p = 0.030566

โปรดทราบว่าเราใช้สมมติฐานว่างและทางเลือกต่อไปนี้สำหรับการทดสอบแต่ละครั้ง:

  • H 0 : β i = 0 (ความชันเท่ากับศูนย์)
  • HA : β i ≠ 0 (ความชันไม่เท่ากับศูนย์)

หากค่า p ของการทดสอบทีต่ำกว่าเกณฑ์ที่กำหนด (เช่น α = 0.05) เราจะปฏิเสธสมมติฐานว่างและสรุปว่ามีความสัมพันธ์ที่มีนัยสำคัญทางสถิติระหว่างตัวแปรทำนายและตัวแปรตอบสนอง

เนื่องจากค่า p สำหรับการทดสอบแต่ละครั้งมีค่าน้อยกว่า 0.05 เราจะสรุปได้ว่าตัวแปรทำนายแต่ละตัวในแบบจำลองมีความสัมพันธ์ที่มีนัยสำคัญทางสถิติกับตัวแปรตอบสนอง

ในบริบทของตัวอย่างนี้ เราจะบอกว่าชั่วโมงที่ใช้ในการศึกษาและจำนวนข้อสอบฝึกหัดที่สอบ ล้วนเป็นตัวทำนายผลสอบปลายภาคที่มีนัยสำคัญทางสถิติของนักเรียน

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้ให้ข้อมูลเพิ่มเติมเกี่ยวกับการถดถอยเชิงเส้นใน R:

วิธีการตีความเอาต์พุตการถดถอยใน R
วิธีดำเนินการถดถอยเชิงเส้นอย่างง่ายใน R
วิธีดำเนินการถดถอยเชิงเส้นพหุคูณใน R
วิธีดำเนินการถดถอยโลจิสติกใน R

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *