วิธีทำการทดสอบทีสำหรับความชันของเส้นการถดถอยใน r
เราทำการ ถดถอยเชิงเส้นอย่างง่าย เราจะได้สมการการถดถอยโดยประมาณดังต่อไปนี้:
ŷ = ข 0 + ข 1 x
โดยทั่วไปเราต้องการทราบว่าค่าสัมประสิทธิ์ความชัน b 1 มีนัยสำคัญทางสถิติหรือไม่
เพื่อตรวจสอบว่า b 1 มีนัยสำคัญทางสถิติหรือไม่ เราสามารถทำการทดสอบทีโดยใช้สถิติการทดสอบต่อไปนี้:
เสื้อ = ข 1 / se(ข 1 )
ทอง:
- se(b 1 ) แสดงถึงข้อผิดพลาดมาตรฐานของ b 1
จากนั้นเราสามารถคำนวณ ค่า p ซึ่งสอดคล้องกับสถิติการทดสอบนี้โดยมีดีกรีอิสระ n-2
หากค่า p น้อยกว่าเกณฑ์ที่กำหนด (เช่น α = 0.05) เราก็สรุปได้ว่าค่าสัมประสิทธิ์ความชันไม่เป็นศูนย์
กล่าวอีกนัยหนึ่ง มีความสัมพันธ์ที่มีนัยสำคัญทางสถิติระหว่างตัวแปรทำนายและ ตัวแปรตอบสนอง ในแบบจำลอง
ตัวอย่างต่อไปนี้แสดงวิธีดำเนินการทดสอบค่าความชันของเส้นการถดถอยใน R
ตัวอย่าง: การรันการทดสอบทีสำหรับความชันของเส้นการถดถอยใน R
สมมติว่าเรามีกรอบข้อมูลต่อไปนี้ใน R ซึ่งมีข้อมูลเกี่ยวกับชั่วโมงที่ศึกษาและคะแนนสอบปลายภาคที่นักเรียน 12 คนในชั้นเรียนทำได้:
#create data frame df <- data. frame (hours=c(1, 1, 2, 2, 3, 4, 5, 5, 5, 6, 6, 8), score=c(65, 67, 78, 75, 73, 84, 80, 76, 89, 91, 83, 82)) #view data frame df hours score 1 1 65 2 1 67 3 2 78 4 2 75 5 3 73 6 4 84 7 5 80 8 5 76 9 5 89 10 6 91 11 6 83 12 8 82
สมมติว่าเราต้องการใช้แบบจำลองการถดถอยเชิงเส้นอย่างง่ายเพื่อพิจารณาว่ามีความสัมพันธ์ที่มีนัยสำคัญทางสถิติระหว่างชั่วโมงเรียนกับคะแนนสอบหรือไม่
เราสามารถใช้ฟังก์ชัน lm() ใน R เพื่อให้พอดีกับโมเดลการถดถอยนี้:
#fit simple linear regression model fit <- lm(score ~ hours, data=df) #view model summary summary(fit) Call: lm(formula = score ~ hours, data = df) Residuals: Min 1Q Median 3Q Max -7,398 -3,926 -1,139 4,972 7,713 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 67.7685 3.3757 20.075 2.07e-09 *** hours 2.7037 0.7456 3.626 0.00464 ** --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 5.479 on 10 degrees of freedom Multiple R-squared: 0.568, Adjusted R-squared: 0.5248 F-statistic: 13.15 on 1 and 10 DF, p-value: 0.004641
จากผลลัพธ์ของแบบจำลอง เราจะเห็นว่าสมการการถดถอยโดยประมาณคือ:
คะแนนสอบ = 67.7685 + 2.7037 (ชั่วโมง)
เพื่อทดสอบว่าค่าสัมประสิทธิ์ความชันมีนัยสำคัญทางสถิติหรือไม่ เราสามารถคำนวณสถิติการทดสอบทีได้ดังนี้:
- เสื้อ = ข 1 / se(ข 1 )
- เสื้อ = 2.7037 / 0.7456
- เสื้อ = 3.626
ค่า p ที่สอดคล้องกับสถิติการทดสอบทีนี้จะแสดงในคอลัมน์ชื่อ Pr(> |t|) ในเอาต์พุต
ค่า p กลายเป็น 0.00464
เนื่องจากค่า p นี้น้อยกว่า 0.05 เราจึงสรุปได้ว่าค่าสัมประสิทธิ์ความชันมีนัยสำคัญทางสถิติ
กล่าวอีกนัยหนึ่ง มีความสัมพันธ์ที่มีนัยสำคัญทางสถิติระหว่างจำนวนชั่วโมงเรียนกับเกรดสุดท้ายที่นักเรียนได้รับจากการสอบ
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้จะอธิบายวิธีดำเนินการงานทั่วไปอื่นๆ ใน R:
วิธีดำเนินการถดถอยเชิงเส้นอย่างง่ายใน R
วิธีดำเนินการถดถอยเชิงเส้นพหุคูณใน R
วิธีการตีความเอาต์พุตการถดถอยใน R