การรักร่วมเพศ
บทความนี้จะอธิบายว่าการรักร่วมเพศคืออะไรในสถิติ ดังนั้น คุณจะพบคำจำกัดความของความเป็นโฮโมสซิดาสติกซิตี อะไรคือสาเหตุของแบบจำลองการถดถอยที่ไม่มีโฮโมสซิดาสติกซิตี และอื่นๆ อีกมากมาย วิธีแก้ไข
การรักร่วมเพศคืออะไร?
ความเป็นเนื้อเดียวกัน เป็นคุณลักษณะของแบบจำลองการถดถอยซึ่งมีข้อผิดพลาดของตัวแปรอธิบายมีความแปรปรวนคงที่ นั่นคือ เมื่อความแปรปรวนของข้อผิดพลาดของแบบจำลองการถดถอยคงที่ โมเดลดังกล่าวจะแสดงความเป็นโฮโมสซิดาสติก และด้วยเหตุนี้ มันจึงเป็นแบบจำลองโฮโมสซิดาสติก
โปรดจำไว้ว่าข้อผิดพลาด (หรือค่าคงเหลือ) ถูกกำหนดให้เป็นความแตกต่างระหว่างมูลค่าจริงและค่าที่ประมาณโดยแบบจำลองการถดถอย
เมื่อรันโมเดลการถดถอย เราจะได้รับค่าที่แตกต่างจากนิพจน์ก่อนหน้าสำหรับการสังเกตแต่ละครั้ง ดังนั้นแบบจำลองทางสถิติแบบโฮโมสเคดาสติกจึงเป็นแบบจำลองหนึ่งที่ความแปรปรวนของข้อผิดพลาดที่คำนวณได้คงที่ตลอดการสังเกต
สิ่งสำคัญคือแบบจำลองการถดถอยจะต้องแสดงความเป็นเนื้อเดียวกัน อันที่จริง นี่เป็นหนึ่งในสมมติฐานก่อนหน้าของแบบจำลองการถดถอย หากส่วนที่เหลือไม่ถือเป็นโฮโมสซิดาสติก จะเป็นการดีกว่าถ้าทำซ้ำแบบจำลองด้วยวิธีอื่นเพื่อให้ได้โฮโมสซิดาสติก มิฉะนั้น การประมาณ ค่าสัมประสิทธิ์การถดถอย มีแนวโน้มที่จะผิดพลาด และข้อผิดพลาดใน การทดสอบสมมติฐาน ก็จะเกิดขึ้นโดยการยอมรับสมมติฐานว่างที่ควรถูกปฏิเสธจริง ๆ
สาเหตุของการขาดการรักร่วมเพศ
สาเหตุที่พบบ่อยที่สุดที่ทำให้โมเดลไม่มีภาวะโฮโมสซีดาสติกคือ:
- เมื่อ ช่วงข้อมูล กว้างมากเมื่อเทียบกับค่าเฉลี่ย หากในตัวอย่างทางสถิติเดียวกันนั้นมีค่ามากและมีค่าน้อยมากก็มีแนวโน้มว่าแบบจำลองการถดถอยที่ได้รับนั้นไม่ใช่แบบโฮโมสซิดาสติก
- การละเว้นตัวแปรในแบบจำลองการถดถอยยังส่งผลให้ขาดความคล้ายคลึงกัน ตามหลักเหตุผลแล้ว หากตัวแปรที่เกี่ยวข้องไม่รวมอยู่ในแบบจำลอง ความแปรผันของตัวแปรนั้นจะถูกรวมไว้ในส่วนที่เหลือและไม่จำเป็นต้องได้รับการแก้ไข
- การเปลี่ยนแปลงโครงสร้างอาจทำให้โมเดลไม่พอดีกับชุดข้อมูล ดังนั้นความแปรปรวนของส่วนที่เหลือจึงไม่คงที่
- เมื่อตัวแปรบางตัวมีค่ามากกว่าตัวแปรอธิบายอื่น ๆ แบบจำลองอาจไม่มีความคล้ายคลึงกัน ในกรณีนี้ ตัวแปรสามารถสัมพันธ์กันเพื่อแก้ไขปัญหาได้
อย่างไรก็ตาม มีบางกรณีที่เป็นเรื่องยากโดยเนื้อแท้ที่จะนำเสนอว่าเป็นภาวะรักร่วมเพศ ตัวอย่างเช่น ถ้าเราจำลองรายได้ของบุคคลด้วยการใช้จ่ายด้านอาหาร คนที่ร่ำรวยกว่าจะมีความแปรปรวนในการใช้จ่ายด้านอาหารมากกว่าคนที่ยากจน เพราะคนรวยบางครั้งกินในร้านอาหารแพงๆ และบางครั้งก็กินในร้านอาหารราคาถูก ไม่เหมือนคนจนที่มักจะกินในร้านอาหารราคาถูก ดังนั้นจึงเป็นเรื่องยากที่จะบรรลุความเป็นเนื้อเดียวกันในแบบจำลองการถดถอย
การแก้ไขข้อมูลเพื่อให้เกิดความสม่ำเสมอ
เมื่อแบบจำลองการถดถอยที่ได้รับไม่ใช่แบบโฮโมสซิดาสติก คุณสามารถพยายามแก้ไขต่อไปนี้เพื่อให้ได้โฮโมสซิดาสติก:
- คำนวณลอการิทึมธรรมชาติของตัวแปรอิสระ ซึ่งโดยทั่วไปจะมีประโยชน์เมื่อความแปรปรวนของส่วนที่เหลือเพิ่มขึ้นในกราฟ
- การเปลี่ยนแปลงประเภทอื่นของตัวแปรอิสระอาจใช้งานได้จริงมากกว่าทั้งนี้ขึ้นอยู่กับพล็อตที่เหลือ ตัวอย่างเช่น หากกราฟอยู่ในรูปพาราโบลา เราสามารถคำนวณกำลังสองของตัวแปรอิสระและเพิ่มตัวแปรนั้นลงในแบบจำลองได้
- ตัวแปรอื่นๆ ยังสามารถใช้สำหรับแบบจำลองได้ การลบหรือเพิ่มตัวแปรจะทำให้ความแปรปรวนของค่าคงเหลือสามารถแก้ไขได้
- แทนที่จะใช้เกณฑ์กำลังสองน้อยที่สุด คุณสามารถใช้เกณฑ์กำลังสองน้อยสุดถ่วงน้ำหนักได้
Homoscedasticity และ Heteroskedasticity
ในที่สุด เราจะเห็นว่าอะไรคือความแตกต่างระหว่างโฮโมสเคดาสติกซิตี้และเฮเทอโรสเคดาสติกซิตี้ เนื่องจากเป็นแนวคิดทางสถิติที่สำคัญสองประการของแบบจำลองการถดถอย
Heteroscedasticity เป็นคุณลักษณะทางสถิติที่บอกเป็นนัยว่าส่วนที่เหลือของแบบจำลองการถดถอยไม่มีความแปรปรวนคงที่ ดังนั้นความแปรปรวนของข้อผิดพลาดจึงไม่เหมือนกันตลอดทั้งโครงเรื่อง
ความแตกต่างระหว่าง homoscedasticity และ heteroskedasticity คือความคงที่ของความแปรปรวนของข้อผิดพลาด Homoskedasticity บ่งบอกว่าความแปรปรวนของข้อผิดพลาดคงที่ ในขณะที่ Heteroscedasticity บ่งบอกว่าความแปรปรวนของข้อผิดพลาดไม่คงที่