วิธีคำนวณ d ของโคเฮนใน r (พร้อมตัวอย่าง)


ในสถิติ เรามักจะใช้ ค่า p เพื่อพิจารณาว่ามีความแตกต่างที่มีนัยสำคัญทางสถิติระหว่างค่าเฉลี่ยของทั้งสองกลุ่มหรือไม่

อย่างไรก็ตาม แม้ว่าค่า p-value จะบอกเราได้ว่ามีความแตกต่างที่มีนัยสำคัญทางสถิติระหว่างสองกลุ่มหรือไม่ แต่ ขนาดของเอฟเฟกต์ สามารถบอกเราได้ว่าจริงๆ แล้วความแตกต่างนั้นใหญ่แค่ไหน

หนึ่งในการวัดขนาดเอฟเฟกต์ที่พบบ่อยที่สุดคือ d ของโคเฮน ซึ่งคำนวณได้ดังนี้:

D ของโคเฮน = ( x1x2 ) / ( s12 + s22 ) / 2

ทอง:

  • x 1 , x 2 : ค่าเฉลี่ยของตัวอย่างที่ 1 และตัวอย่างที่ 2 ตามลำดับ
  • s 1 2 , s 2 2 : ความแปรปรวนของตัวอย่างที่ 1 และตัวอย่างที่ 2 ตามลำดับ

เมื่อใช้สูตรนี้ นี่คือวิธีที่เราตีความ d ของโคเฮน:

  • ค่า d 0.5 บ่งชี้ว่าค่าเฉลี่ยของทั้งสองกลุ่มต่างกันด้วยส่วนเบี่ยงเบนมาตรฐาน 0.5
  • d ของ 1 บ่งชี้ว่าค่าเฉลี่ยกลุ่มต่างกัน 1 ส่วนเบี่ยงเบนมาตรฐาน
  • d ของ 2 แสดงว่าค่าเฉลี่ยของกลุ่มต่างกัน 2 ส่วนเบี่ยงเบนมาตรฐาน

และอื่นๆ

นี่เป็นอีกวิธีหนึ่งในการตีความ d ของโคเฮน: ขนาดเอฟเฟกต์ 0.5 หมายความว่าค่าของคนโดยเฉลี่ยในกลุ่ม 1 คือ 0.5 ส่วนเบี่ยงเบนมาตรฐาน ซึ่งสูงกว่าคนทั่วไปในกลุ่ม 2

เรามักจะใช้กฎง่ายๆ ต่อไปนี้เพื่อตีความ d ของโคเฮน:

  • ค่า 0.2 แสดงถึงขนาดเอฟเฟกต์ขนาดเล็ก
  • ค่า 0.5 หมายถึงขนาดเอฟเฟกต์ปานกลาง
  • ค่า 0.8 แสดงถึงขนาดเอฟเฟกต์ขนาดใหญ่

ตัวอย่างต่อไปนี้แสดงวิธีคำนวณ d ของโคเฮนใน R

ตัวอย่าง: วิธีคำนวณ d ของโคเฮนใน R

สมมติว่านักพฤกษศาสตร์ใส่ปุ๋ยสองชนิดกับพืชเพื่อดูว่ามีการเจริญเติบโตโดยเฉลี่ยของพืชที่แตกต่างกันอย่างมีนัยสำคัญ (หน่วยเป็นนิ้ว) หลังจากผ่านไปหนึ่งเดือนหรือไม่

มีสองวิธีที่เราสามารถใช้เพื่อคำนวณ d ของโคเฮนใน R ได้อย่างรวดเร็ว:

วิธีที่ 1: ใช้แพ็คเกจ lsr

 library (lsr)

#define plant growth values for each group
group1 <- c(8, 9, 11, 11, 12, 14, 15, 16, 16, 18, 20, 21)
group2 <- c(7, 9, 10, 10, 11, 11, 12, 14, 14, 16, 20, 23)

#calculate Cohen's d
cohensD(group1, group2)

[1] 0.2635333

วิธีที่ 2: ใช้แพ็คเกจ effsize

 library (effsize)

#define plant growth values for each group
group1 <- c(8, 9, 11, 11, 12, 14, 15, 16, 16, 18, 20, 21)
group2 <- c(7, 9, 10, 10, 11, 11, 12, 14, 14, 16, 20, 23)

#calculate Cohen's d
cohen.d(group1, group2)

Cohen's d

d estimate: 0.2635333 (small)
95 percent confidence interval:
     lower upper 
-0.5867889 1.1138555

โปรดทราบว่าทั้งสองวิธีให้ผลลัพธ์เหมือนกัน: d ของโคเฮนคือ 0.2635

เราตีความได้ว่าหมายความว่าความสูงเฉลี่ยของพืชที่ได้รับปุ๋ย #1 คือ 0.2635 ส่วนเบี่ยงเบนมาตรฐาน ซึ่งมากกว่าความสูงเฉลี่ยของพืชที่ได้รับปุ๋ย #2

เมื่อใช้หลักทั่วไปที่กล่าวถึงข้างต้น เราจะตีความว่าเป็นขนาดเอฟเฟกต์ขนาดเล็ก

กล่าวอีกนัยหนึ่ง ไม่ว่าการเจริญเติบโตของพืชโดยเฉลี่ยระหว่างปุ๋ยทั้งสองจะมีความแตกต่างที่มีนัยสำคัญทางสถิติหรือไม่ก็ตาม ความแตกต่างที่แท้จริงระหว่างค่าเฉลี่ยของกลุ่มนั้นไม่มีนัยสำคัญ

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้ให้ข้อมูลเพิ่มเติมเกี่ยวกับขนาดเอฟเฟกต์และ d ของ Cohen:

ขนาดเอฟเฟกต์: คืออะไรและเหตุใดจึงสำคัญ
วิธีการคำนวณ d ของโคเฮนใน Excel

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *