วิธีคำนวณ d ของโคเฮนใน r (พร้อมตัวอย่าง)
ในสถิติ เรามักจะใช้ ค่า p เพื่อพิจารณาว่ามีความแตกต่างที่มีนัยสำคัญทางสถิติระหว่างค่าเฉลี่ยของทั้งสองกลุ่มหรือไม่
อย่างไรก็ตาม แม้ว่าค่า p-value จะบอกเราได้ว่ามีความแตกต่างที่มีนัยสำคัญทางสถิติระหว่างสองกลุ่มหรือไม่ แต่ ขนาดของเอฟเฟกต์ สามารถบอกเราได้ว่าจริงๆ แล้วความแตกต่างนั้นใหญ่แค่ไหน
หนึ่งในการวัดขนาดเอฟเฟกต์ที่พบบ่อยที่สุดคือ d ของโคเฮน ซึ่งคำนวณได้ดังนี้:
D ของโคเฮน = ( x1 – x2 ) / √ ( s12 + s22 ) / 2
ทอง:
- x 1 , x 2 : ค่าเฉลี่ยของตัวอย่างที่ 1 และตัวอย่างที่ 2 ตามลำดับ
- s 1 2 , s 2 2 : ความแปรปรวนของตัวอย่างที่ 1 และตัวอย่างที่ 2 ตามลำดับ
เมื่อใช้สูตรนี้ นี่คือวิธีที่เราตีความ d ของโคเฮน:
- ค่า d 0.5 บ่งชี้ว่าค่าเฉลี่ยของทั้งสองกลุ่มต่างกันด้วยส่วนเบี่ยงเบนมาตรฐาน 0.5
- d ของ 1 บ่งชี้ว่าค่าเฉลี่ยกลุ่มต่างกัน 1 ส่วนเบี่ยงเบนมาตรฐาน
- d ของ 2 แสดงว่าค่าเฉลี่ยของกลุ่มต่างกัน 2 ส่วนเบี่ยงเบนมาตรฐาน
และอื่นๆ
นี่เป็นอีกวิธีหนึ่งในการตีความ d ของโคเฮน: ขนาดเอฟเฟกต์ 0.5 หมายความว่าค่าของคนโดยเฉลี่ยในกลุ่ม 1 คือ 0.5 ส่วนเบี่ยงเบนมาตรฐาน ซึ่งสูงกว่าคนทั่วไปในกลุ่ม 2
เรามักจะใช้กฎง่ายๆ ต่อไปนี้เพื่อตีความ d ของโคเฮน:
- ค่า 0.2 แสดงถึงขนาดเอฟเฟกต์ขนาดเล็ก
- ค่า 0.5 หมายถึงขนาดเอฟเฟกต์ปานกลาง
- ค่า 0.8 แสดงถึงขนาดเอฟเฟกต์ขนาดใหญ่
ตัวอย่างต่อไปนี้แสดงวิธีคำนวณ d ของโคเฮนใน R
ตัวอย่าง: วิธีคำนวณ d ของโคเฮนใน R
สมมติว่านักพฤกษศาสตร์ใส่ปุ๋ยสองชนิดกับพืชเพื่อดูว่ามีการเจริญเติบโตโดยเฉลี่ยของพืชที่แตกต่างกันอย่างมีนัยสำคัญ (หน่วยเป็นนิ้ว) หลังจากผ่านไปหนึ่งเดือนหรือไม่
มีสองวิธีที่เราสามารถใช้เพื่อคำนวณ d ของโคเฮนใน R ได้อย่างรวดเร็ว:
วิธีที่ 1: ใช้แพ็คเกจ lsr
library (lsr) #define plant growth values for each group group1 <- c(8, 9, 11, 11, 12, 14, 15, 16, 16, 18, 20, 21) group2 <- c(7, 9, 10, 10, 11, 11, 12, 14, 14, 16, 20, 23) #calculate Cohen's d cohensD(group1, group2) [1] 0.2635333
วิธีที่ 2: ใช้แพ็คเกจ effsize
library (effsize) #define plant growth values for each group group1 <- c(8, 9, 11, 11, 12, 14, 15, 16, 16, 18, 20, 21) group2 <- c(7, 9, 10, 10, 11, 11, 12, 14, 14, 16, 20, 23) #calculate Cohen's d cohen.d(group1, group2) Cohen's d d estimate: 0.2635333 (small) 95 percent confidence interval: lower upper -0.5867889 1.1138555
โปรดทราบว่าทั้งสองวิธีให้ผลลัพธ์เหมือนกัน: d ของโคเฮนคือ 0.2635
เราตีความได้ว่าหมายความว่าความสูงเฉลี่ยของพืชที่ได้รับปุ๋ย #1 คือ 0.2635 ส่วนเบี่ยงเบนมาตรฐาน ซึ่งมากกว่าความสูงเฉลี่ยของพืชที่ได้รับปุ๋ย #2
เมื่อใช้หลักทั่วไปที่กล่าวถึงข้างต้น เราจะตีความว่าเป็นขนาดเอฟเฟกต์ขนาดเล็ก
กล่าวอีกนัยหนึ่ง ไม่ว่าการเจริญเติบโตของพืชโดยเฉลี่ยระหว่างปุ๋ยทั้งสองจะมีความแตกต่างที่มีนัยสำคัญทางสถิติหรือไม่ก็ตาม ความแตกต่างที่แท้จริงระหว่างค่าเฉลี่ยของกลุ่มนั้นไม่มีนัยสำคัญ
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้ให้ข้อมูลเพิ่มเติมเกี่ยวกับขนาดเอฟเฟกต์และ d ของ Cohen:
ขนาดเอฟเฟกต์: คืออะไรและเหตุใดจึงสำคัญ
วิธีการคำนวณ d ของโคเฮนใน Excel