วิธีการคำนวณค่า p ของสถิติ f ในหน่วย r
การทดสอบ F จะสร้าง สถิติ F หากต้องการค้นหา ค่า p ที่เกี่ยวข้องกับสถิติ F ใน R คุณสามารถใช้คำสั่งต่อไปนี้:
pf(fstat, df1, df2, lower.tail = FALSE)
- fstat – ค่าของสถิติ f
- df1 – องศาอิสระ 1
- df2 – องศาอิสระ 2
- lower.tail – จะส่งคืนค่าความน่าจะเป็นที่เกี่ยวข้องกับส่วนท้ายล่างของการแจกแจงแบบ F หรือไม่ นี่เป็น TRUE โดยค่าเริ่มต้น
ตัวอย่างเช่น ต่อไปนี้เป็นวิธีค้นหาค่า p ที่เกี่ยวข้องกับสถิติ F เท่ากับ 5 โดยมีดีกรีอิสระ 1 = 3 และดีกรีอิสระ 2 = 14:
pf(5, 3, 14, lower.tail = FALSE) #[1] 0.01457807
หนึ่งในการใช้ F-test ที่พบบ่อยที่สุดคือการ ทดสอบความสำคัญโดยรวมของแบบจำลองการถดถอย ในตัวอย่างต่อไปนี้ เราจะแสดงวิธีคำนวณค่า p ของสถิติ F สำหรับแบบจำลองการถดถอย
ตัวอย่าง: การคำนวณค่า p จากสถิติ F
สมมติว่าเรามีชุดข้อมูลที่แสดงจำนวนชั่วโมงเรียนทั้งหมด จำนวนข้อสอบเตรียมสอบทั้งหมดที่สอบ และเกรดการสอบปลายภาคของนักเรียน 12 คน:
#create dataset data <- data.frame(study_hours = c(3, 7, 16, 14, 12, 7, 4, 19, 4, 8, 8, 3), prep_exams = c(2, 6, 5, 2, 7, 4, 4, 2, 8, 4, 1, 3), final_score = c(76, 88, 96, 90, 98, 80, 86, 89, 68, 75, 72, 76)) #view first six rows of dataset head(data) # study_hours prep_exams final_score #1 3 2 76 #2 7 6 88 #3 16 5 96 #4 14 2 90 #5 12 7 98 #6 7 4 80
จากนั้นเราสามารถใส่แบบจำลองการถดถอยเชิงเส้นเข้ากับข้อมูลนี้โดยใช้ ชั่วโมงการศึกษา และ การสอบ เตรียมการเป็นตัวแปรทำนายและ คะแนนสุดท้าย เป็นตัวแปรตอบสนอง จากนั้นเราจะเห็นภาพผลลัพธ์ของโมเดลได้:
#fit regression model model <- lm(final_score ~ study_hours + prep_exams, data = data) #view output of the model summary(model) #Call: #lm(formula = final_score ~ study_hours + prep_exams, data = data) # #Residuals: # Min 1Q Median 3Q Max #-13,128 -5,319 2,168 3,458 9,341 # #Coefficients: #Estimate Std. Error t value Pr(>|t|) #(Intercept) 66,990 6,211 10,785 1.9e-06 *** #study_hours 1.300 0.417 3.117 0.0124 * #prep_exams 1.117 1.025 1.090 0.3041 #--- #Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 # #Residual standard error: 7.327 on 9 degrees of freedom #Multiple R-squared: 0.5308, Adjusted R-squared: 0.4265 #F-statistic: 5.091 on 2 and 9 DF, p-value: 0.0332
ในแถวสุดท้ายของผลลัพธ์ เราจะเห็นว่าสถิติ F สำหรับแบบจำลองการถดถอยโดยรวมคือ 5.091 สถิติ F นี้มีดีกรีอิสระ 2 องศาสำหรับตัวเศษ และดีกรีอิสระ 9 องศาสำหรับตัวส่วน R จะคำนวณโดยอัตโนมัติว่าค่า p สำหรับสถิติ F นี้คือ 0.0332
ในการคำนวณค่า p ที่เท่ากันนี้ด้วยตัวเราเอง เราสามารถใช้โค้ดต่อไปนี้:
pf(5.091, 2, 9, lower.tail = FALSE) #[1] 0.0331947
โปรดทราบว่าเราได้รับคำตอบเดียวกัน (แต่แสดงตำแหน่งทศนิยมมากกว่า) เป็นผลลัพธ์การถดถอยเชิงเส้นด้านบน