วิธีการคำนวณความสัมพันธ์ระหว่างตัวแปรต่อเนื่องและตัวแปรตามหมวดหมู่


เมื่อเราต้องการคำนวณความสัมพันธ์ระหว่างตัวแปรต่อเนื่องสองตัว โดยทั่วไปเราจะใช้ สัมประสิทธิ์สหสัมพันธ์แบบเพียร์สัน

อย่างไรก็ตาม เมื่อเราต้องการคำนวณความสัมพันธ์ระหว่างตัวแปรต่อเนื่องและ ตัวแปรเชิงหมวดหมู่ เราสามารถใช้สิ่งที่เรียกว่าความ สัมพันธ์แบบทวิฐานแบบจุด

ความสัมพันธ์แบบพอยต์ไบซีเรียลใช้ในการคำนวณความสัมพันธ์ระหว่างตัวแปรหมวดหมู่ไบนารี (ตัวแปรที่รับได้เพียงสองค่าเท่านั้น) กับตัวแปรต่อเนื่อง โดยมีคุณสมบัติดังต่อไปนี้

  • ความสัมพันธ์แบบพอยต์-ไบซีเรียลอาจแตกต่างกันระหว่าง -1 ถึง 1
  • สำหรับแต่ละกลุ่มที่สร้างโดยตัวแปรไบนารี่ จะถือว่าปกติตัวแปรต่อเนื่องจะมีการแจกแจงด้วยความแปรปรวนเท่ากัน
  • สำหรับแต่ละกลุ่มที่สร้างขึ้นโดยตัวแปรไบนารี่ จะถือว่าไม่มีค่าผิดปกติที่รุนแรง

ตัวอย่างต่อไปนี้แสดงวิธีคำนวณความสัมพันธ์แบบจุด-ไบซีเรียลในทางปฏิบัติ

ตัวอย่าง: การคำนวณความสัมพันธ์แบบพอยต์-ไบซีเรียล

สมมติว่าอาจารย์มหาวิทยาลัยต้องการตรวจสอบว่ามีความสัมพันธ์ระหว่างเพศและคะแนนในการสอบวัดคุณสมบัติเฉพาะหรือไม่

เขารวบรวมข้อมูลต่อไปนี้เกี่ยวกับเด็กชาย 12 คนและเด็กหญิง 12 คนในชั้นเรียนของเขา:

เนื่องจาก เพศ เป็นตัวแปรเชิงหมวดหมู่และ คะแนน เป็นตัวแปรต่อเนื่อง จึงสมเหตุสมผลที่จะคำนวณความสัมพันธ์แบบจุด-ไบซีเรียลระหว่างตัวแปรทั้งสอง

ศาสตราจารย์สามารถใช้ซอฟต์แวร์ทางสถิติใดก็ได้ (รวมถึง Excel, R, Python, SPSS, Stata) เพื่อคำนวณความสัมพันธ์แบบจุด-ไบซีเรียลระหว่างตัวแปรทั้งสอง

รหัสต่อไปนี้แสดงวิธีคำนวณความสัมพันธ์แบบ point-biserial ใน R โดยใช้ค่า 0 แทนเพศหญิง และ 1 แทนเพศชายสำหรับตัวแปรเพศ:

 #define values for gender
gender <- c(0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
            1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1)

#define values for score
score <- c(77, 78, 79, 79, 82, 84, 85, 88, 89, 91, 91, 94,
           84, 84, 84, 85, 85, 86, 86, 86, 89, 91, 94, 98)

#calculate point-biserial correlation
horn. test (gender, score)

	Pearson's product-moment correlation

data: gender and score
t = 1.3739, df = 22, p-value = 0.1833
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 -0.1379386 0.6147832
sample estimates:
      horn 
0.2810996

จากผลลัพธ์เราจะเห็นว่าค่าสัมประสิทธิ์สหสัมพันธ์แบบจุด-ไบซีเรียลคือ 0.281 และค่า p ที่สอดคล้องกันคือ 0.1833

เนื่องจากค่าสัมประสิทธิ์สหสัมพันธ์เป็นบวก จึงบอกเราว่ามีความสัมพันธ์เชิงบวกระหว่างเพศและคะแนน

เนื่องจากเรากำหนดรหัสเพศชายเป็น 1 และเพศหญิงเป็น 0 สิ่งนี้บ่งชี้ว่าคะแนนมีแนวโน้มที่จะสูงกว่าสำหรับผู้ชาย (กล่าวคือ คะแนนมีแนวโน้มที่จะเพิ่มขึ้นเมื่อเพศ “เพิ่มขึ้น”) » จาก 0 ถึง 1)

อย่างไรก็ตาม เนื่องจากค่า p ไม่น้อยกว่า 0.05 สัมประสิทธิ์สหสัมพันธ์นี้จึงไม่มีนัยสำคัญทางสถิติ

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้จะอธิบายวิธีคำนวณความสัมพันธ์แบบไบซีเรียลแบบจุดโดยใช้ซอฟต์แวร์ทางสถิติต่างๆ

วิธีการคำนวณความสัมพันธ์แบบ point-biserial ใน Excel
วิธีการคำนวณความสัมพันธ์แบบพอยต์-ไบซีเรียลใน R
วิธีการคำนวณความสัมพันธ์แบบ point-biserial ใน Python

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *