วิธีทำการทดสอบทีสำหรับความชันของเส้นการถดถอยใน r


เราทำการ ถดถอยเชิงเส้นอย่างง่าย เราจะได้สมการการถดถอยโดยประมาณดังต่อไปนี้:

ŷ = ข 0 + ข 1 x

โดยทั่วไปเราต้องการทราบว่าค่าสัมประสิทธิ์ความชัน b 1 มีนัยสำคัญทางสถิติหรือไม่

เพื่อตรวจสอบว่า b 1 มีนัยสำคัญทางสถิติหรือไม่ เราสามารถทำการทดสอบทีโดยใช้สถิติการทดสอบต่อไปนี้:

เสื้อ = ข 1 / se(ข 1 )

ทอง:

  • se(b 1 ) แสดงถึงข้อผิดพลาดมาตรฐานของ b 1

จากนั้นเราสามารถคำนวณ ค่า p ซึ่งสอดคล้องกับสถิติการทดสอบนี้โดยมีดีกรีอิสระ n-2

หากค่า p น้อยกว่าเกณฑ์ที่กำหนด (เช่น α = 0.05) เราก็สรุปได้ว่าค่าสัมประสิทธิ์ความชันไม่เป็นศูนย์

กล่าวอีกนัยหนึ่ง มีความสัมพันธ์ที่มีนัยสำคัญทางสถิติระหว่างตัวแปรทำนายและ ตัวแปรตอบสนอง ในแบบจำลอง

ตัวอย่างต่อไปนี้แสดงวิธีดำเนินการทดสอบค่าความชันของเส้นการถดถอยใน R

ตัวอย่าง: การรันการทดสอบทีสำหรับความชันของเส้นการถดถอยใน R

สมมติว่าเรามีกรอบข้อมูลต่อไปนี้ใน R ซึ่งมีข้อมูลเกี่ยวกับชั่วโมงที่ศึกษาและคะแนนสอบปลายภาคที่นักเรียน 12 คนในชั้นเรียนทำได้:

 #create data frame
df <- data. frame (hours=c(1, 1, 2, 2, 3, 4, 5, 5, 5, 6, 6, 8),
                 score=c(65, 67, 78, 75, 73, 84, 80, 76, 89, 91, 83, 82))

#view data frame
df

   hours score
1 1 65
2 1 67
3 2 78
4 2 75
5 3 73
6 4 84
7 5 80
8 5 76
9 5 89
10 6 91
11 6 83
12 8 82

สมมติว่าเราต้องการใช้แบบจำลองการถดถอยเชิงเส้นอย่างง่ายเพื่อพิจารณาว่ามีความสัมพันธ์ที่มีนัยสำคัญทางสถิติระหว่างชั่วโมงเรียนกับคะแนนสอบหรือไม่

เราสามารถใช้ฟังก์ชัน lm() ใน R เพื่อให้พอดีกับโมเดลการถดถอยนี้:

 #fit simple linear regression model
fit <- lm(score ~ hours, data=df)

#view model summary
summary(fit)

Call:
lm(formula = score ~ hours, data = df)

Residuals:
   Min 1Q Median 3Q Max 
-7,398 -3,926 -1,139 4,972 7,713 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 67.7685 3.3757 20.075 2.07e-09 ***
hours 2.7037 0.7456 3.626 0.00464 ** 
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 5.479 on 10 degrees of freedom
Multiple R-squared: 0.568, Adjusted R-squared: 0.5248 
F-statistic: 13.15 on 1 and 10 DF, p-value: 0.004641

จากผลลัพธ์ของแบบจำลอง เราจะเห็นว่าสมการการถดถอยโดยประมาณคือ:

คะแนนสอบ = 67.7685 + 2.7037 (ชั่วโมง)

เพื่อทดสอบว่าค่าสัมประสิทธิ์ความชันมีนัยสำคัญทางสถิติหรือไม่ เราสามารถคำนวณสถิติการทดสอบทีได้ดังนี้:

  • เสื้อ = ข 1 / se(ข 1 )
  • เสื้อ = 2.7037 / 0.7456
  • เสื้อ = 3.626

ค่า p ที่สอดคล้องกับสถิติการทดสอบทีนี้จะแสดงในคอลัมน์ชื่อ Pr(> |t|) ในเอาต์พุต

ค่า p กลายเป็น 0.00464

เนื่องจากค่า p นี้น้อยกว่า 0.05 เราจึงสรุปได้ว่าค่าสัมประสิทธิ์ความชันมีนัยสำคัญทางสถิติ

กล่าวอีกนัยหนึ่ง มีความสัมพันธ์ที่มีนัยสำคัญทางสถิติระหว่างจำนวนชั่วโมงเรียนกับเกรดสุดท้ายที่นักเรียนได้รับจากการสอบ

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้จะอธิบายวิธีดำเนินการงานทั่วไปอื่นๆ ใน R:

วิธีดำเนินการถดถอยเชิงเส้นอย่างง่ายใน R
วิธีดำเนินการถดถอยเชิงเส้นพหุคูณใน R
วิธีการตีความเอาต์พุตการถดถอยใน R

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *