ตัวแปรไดโคโตมัสคืออะไร? (คำจำกัดความ & #038; ตัวอย่าง)
ตัวแปรแบบไดโคโตมัส คือตัวแปรประเภทหนึ่งที่รับค่าที่เป็นไปได้เพียงสองค่าเท่านั้น
นี่คือตัวอย่างบางส่วนของตัวแปรแบบไดโคโตมัส:
- เพศ: ชายหรือหญิง
- พลิกเหรียญ: หัวหรือก้อย
- ประเภทอสังหาริมทรัพย์: ที่อยู่อาศัยหรือเชิงพาณิชย์
- สถานะนักกีฬา: มืออาชีพหรือมือสมัครเล่น
- ผลการสอบ: ผ่านหรือล้มเหลว
ตัวแปรประเภทนี้เกิดขึ้นตลอดเวลาในทางปฏิบัติ ตัวอย่างเช่น พิจารณาชุดข้อมูลต่อไปนี้ซึ่งมี การสังเกต 10 รายการและตัวแปร 4 รายการ:

ตัวแปร เพศ และ การชนะการแข่งขันชิงแชมป์ เป็นแบบขั้วคู่เนื่องจากแต่ละค่าสามารถรับค่าที่เป็นไปได้เพียงสองค่าเท่านั้น:

อย่างไรก็ตาม ตัวแปร ดิวิชั่น และ คะแนนเฉลี่ย จะไม่เป็นแบบสองขั้วเนื่องจากสามารถรับค่าได้หลายค่า
เคล็ดลับโบนัส:
คุณสามารถจำไว้ว่าตัวแปรแบบไดโคโตมัสสามารถรับได้เพียงสองค่าโดยจำไว้ว่าคำนำหน้า “di” เป็นคำภาษากรีกที่มีความหมายว่า “สอง” “สองครั้ง” หรือ “สองเท่า”
วิธีสร้างตัวแปรแบบไดโคโตมัส
ควรสังเกตว่าเราสามารถสร้างตัวแปรไดโคโตมัสจากตัวแปรต่อเนื่องได้โดยเพียงแค่แยกค่าตามเกณฑ์ที่กำหนด
ตัวอย่างเช่น ในชุดข้อมูลก่อนหน้านี้ เราสามารถแปลง ตัวแปรคะแนนเฉลี่ย ให้เป็นตัวแปรแบบแบ่งขั้วโดยจำแนกผู้เล่นที่มีค่าเฉลี่ยมากกว่า 15 คะแนนเป็น “ผู้ทำประตูที่ดี” และผู้เล่นที่มีค่าเฉลี่ยต่ำกว่า 15 เป็น “ผู้ทำประตูไม่ดี”:

วิธีแสดงภาพตัวแปรแบบไดโคโตมัส
โดยทั่วไปเราจะเห็นภาพตัวแปรแบบแบ่งขั้วโดยใช้แผนภูมิแท่งธรรมดาเพื่อแสดงความถี่ของแต่ละค่าที่ตัวแปรนั้นสามารถรับได้
ตัวอย่างเช่น แผนภูมิแท่งต่อไปนี้แสดงความถี่ของแต่ละเพศในชุดข้อมูลก่อนหน้า:

นอกจากนี้เรายังสามารถแสดงความถี่เป็นเปอร์เซ็นต์บนแกน y ได้:

สิ่งนี้ช่วยให้เราเห็นได้อย่างง่ายดายว่า 70% ของนักกีฬาทั้งหมดในชุดข้อมูลเป็นผู้ชาย และ 30% เป็นผู้หญิง
วิธีการวิเคราะห์ตัวแปรแบบไดโคโตมัส
มีหลายวิธีในการวิเคราะห์ตัวแปรแบบไดโคโตมัส วิธีที่พบบ่อยที่สุดสองวิธี ได้แก่:
1. การทดสอบ z หนึ่งสัดส่วน
การทดสอบค่า z แบบสัดส่วน เดียวจะกำหนดว่าสัดส่วนที่สังเกตได้จะเท่ากับสัดส่วนทางทฤษฎีหรือไม่
ตัวอย่างเช่น เราสามารถใช้การทดสอบนี้เพื่อพิจารณาว่าสัดส่วนที่แท้จริงของนักกีฬาชายในประชากรที่กำหนดเท่ากับ 50% หรือไม่
2. ความสัมพันธ์แบบพอยต์-ไบซีเรียล
ความสัมพันธ์แบบพอยต์-ไบซีเรียล ใช้ในการวัดความสัมพันธ์ระหว่างตัวแปรแบบไดโคโตมัสและตัวแปรต่อเนื่อง
ความสัมพันธ์ประเภทนี้จะใช้ค่าระหว่าง -1 ถึง 1 โดยที่:
- -1 บ่งชี้ถึงความสัมพันธ์เชิงลบอย่างสมบูรณ์ระหว่างตัวแปรสองตัว
- 0 บ่งชี้ว่าไม่มีความสัมพันธ์กันระหว่างตัวแปรสองตัว
- 1 บ่งชี้ถึงความสัมพันธ์เชิงบวกอย่างสมบูรณ์ระหว่างตัวแปรสองตัว
ตัวอย่างเช่น เราสามารถคำนวณความสัมพันธ์แบบพอยต์-ไบซีเรียลระหว่างเพศและคะแนนเฉลี่ยต่อเกมเพื่อทำความเข้าใจว่าตัวแปรทั้งสองนี้มีความสัมพันธ์กันอย่างใกล้ชิดเพียงใด