การรักร่วมเพศ

บทความนี้จะอธิบายว่าการรักร่วมเพศคืออะไรในสถิติ ดังนั้น คุณจะพบคำจำกัดความของความเป็นโฮโมสซิดาสติกซิตี อะไรคือสาเหตุของแบบจำลองการถดถอยที่ไม่มีโฮโมสซิดาสติกซิตี และอื่นๆ อีกมากมาย วิธีแก้ไข

การรักร่วมเพศคืออะไร?

ความเป็นเนื้อเดียวกัน เป็นคุณลักษณะของแบบจำลองการถดถอยซึ่งมีข้อผิดพลาดของตัวแปรอธิบายมีความแปรปรวนคงที่ นั่นคือ เมื่อความแปรปรวนของข้อผิดพลาดของแบบจำลองการถดถอยคงที่ โมเดลดังกล่าวจะแสดงความเป็นโฮโมสซิดาสติก และด้วยเหตุนี้ มันจึงเป็นแบบจำลองโฮโมสซิดาสติก

โปรดจำไว้ว่าข้อผิดพลาด (หรือค่าคงเหลือ) ถูกกำหนดให้เป็นความแตกต่างระหว่างมูลค่าจริงและค่าที่ประมาณโดยแบบจำลองการถดถอย

e_i=y_i-\widehat{y}_i

เมื่อรันโมเดลการถดถอย เราจะได้รับค่าที่แตกต่างจากนิพจน์ก่อนหน้าสำหรับการสังเกตแต่ละครั้ง ดังนั้นแบบจำลองทางสถิติแบบโฮโมสเคดาสติกจึงเป็นแบบจำลองหนึ่งที่ความแปรปรวนของข้อผิดพลาดที่คำนวณได้คงที่ตลอดการสังเกต

โฮโมสเกดาสติกและเฮเทอโรสเคดาสติติตี้

สิ่งสำคัญคือแบบจำลองการถดถอยจะต้องแสดงความเป็นเนื้อเดียวกัน อันที่จริง นี่เป็นหนึ่งในสมมติฐานก่อนหน้าของแบบจำลองการถดถอย หากส่วนที่เหลือไม่ถือเป็นโฮโมสซิดาสติก จะเป็นการดีกว่าถ้าทำซ้ำแบบจำลองด้วยวิธีอื่นเพื่อให้ได้โฮโมสซิดาสติก มิฉะนั้น การประมาณ ค่าสัมประสิทธิ์การถดถอย มีแนวโน้มที่จะผิดพลาด และข้อผิดพลาดใน การทดสอบสมมติฐาน ก็จะเกิดขึ้นโดยการยอมรับสมมติฐานว่างที่ควรถูกปฏิเสธจริง ๆ

สาเหตุของการขาดการรักร่วมเพศ

สาเหตุที่พบบ่อยที่สุดที่ทำให้โมเดลไม่มีภาวะโฮโมสซีดาสติกคือ:

  • เมื่อ ช่วงข้อมูล กว้างมากเมื่อเทียบกับค่าเฉลี่ย หากในตัวอย่างทางสถิติเดียวกันนั้นมีค่ามากและมีค่าน้อยมากก็มีแนวโน้มว่าแบบจำลองการถดถอยที่ได้รับนั้นไม่ใช่แบบโฮโมสซิดาสติก
  • การละเว้นตัวแปรในแบบจำลองการถดถอยยังส่งผลให้ขาดความคล้ายคลึงกัน ตามหลักเหตุผลแล้ว หากตัวแปรที่เกี่ยวข้องไม่รวมอยู่ในแบบจำลอง ความแปรผันของตัวแปรนั้นจะถูกรวมไว้ในส่วนที่เหลือและไม่จำเป็นต้องได้รับการแก้ไข
  • การเปลี่ยนแปลงโครงสร้างอาจทำให้โมเดลไม่พอดีกับชุดข้อมูล ดังนั้นความแปรปรวนของส่วนที่เหลือจึงไม่คงที่
  • เมื่อตัวแปรบางตัวมีค่ามากกว่าตัวแปรอธิบายอื่น ๆ แบบจำลองอาจไม่มีความคล้ายคลึงกัน ในกรณีนี้ ตัวแปรสามารถสัมพันธ์กันเพื่อแก้ไขปัญหาได้

อย่างไรก็ตาม มีบางกรณีที่เป็นเรื่องยากโดยเนื้อแท้ที่จะนำเสนอว่าเป็นภาวะรักร่วมเพศ ตัวอย่างเช่น ถ้าเราจำลองรายได้ของบุคคลด้วยการใช้จ่ายด้านอาหาร คนที่ร่ำรวยกว่าจะมีความแปรปรวนในการใช้จ่ายด้านอาหารมากกว่าคนที่ยากจน เพราะคนรวยบางครั้งกินในร้านอาหารแพงๆ และบางครั้งก็กินในร้านอาหารราคาถูก ไม่เหมือนคนจนที่มักจะกินในร้านอาหารราคาถูก ดังนั้นจึงเป็นเรื่องยากที่จะบรรลุความเป็นเนื้อเดียวกันในแบบจำลองการถดถอย

การแก้ไขข้อมูลเพื่อให้เกิดความสม่ำเสมอ

เมื่อแบบจำลองการถดถอยที่ได้รับไม่ใช่แบบโฮโมสซิดาสติก คุณสามารถพยายามแก้ไขต่อไปนี้เพื่อให้ได้โฮโมสซิดาสติก:

  • คำนวณลอการิทึมธรรมชาติของตัวแปรอิสระ ซึ่งโดยทั่วไปจะมีประโยชน์เมื่อความแปรปรวนของส่วนที่เหลือเพิ่มขึ้นในกราฟ
  • การเปลี่ยนแปลงประเภทอื่นของตัวแปรอิสระอาจใช้งานได้จริงมากกว่าทั้งนี้ขึ้นอยู่กับพล็อตที่เหลือ ตัวอย่างเช่น หากกราฟอยู่ในรูปพาราโบลา เราสามารถคำนวณกำลังสองของตัวแปรอิสระและเพิ่มตัวแปรนั้นลงในแบบจำลองได้
  • ตัวแปรอื่นๆ ยังสามารถใช้สำหรับแบบจำลองได้ การลบหรือเพิ่มตัวแปรจะทำให้ความแปรปรวนของค่าคงเหลือสามารถแก้ไขได้
  • แทนที่จะใช้เกณฑ์กำลังสองน้อยที่สุด คุณสามารถใช้เกณฑ์กำลังสองน้อยสุดถ่วงน้ำหนักได้

Homoscedasticity และ Heteroskedasticity

ในที่สุด เราจะเห็นว่าอะไรคือความแตกต่างระหว่างโฮโมสเคดาสติกซิตี้และเฮเทอโรสเคดาสติกซิตี้ เนื่องจากเป็นแนวคิดทางสถิติที่สำคัญสองประการของแบบจำลองการถดถอย

Heteroscedasticity เป็นคุณลักษณะทางสถิติที่บอกเป็นนัยว่าส่วนที่เหลือของแบบจำลองการถดถอยไม่มีความแปรปรวนคงที่ ดังนั้นความแปรปรวนของข้อผิดพลาดจึงไม่เหมือนกันตลอดทั้งโครงเรื่อง

ความแตกต่างระหว่าง homoscedasticity และ heteroskedasticity คือความคงที่ของความแปรปรวนของข้อผิดพลาด Homoskedasticity บ่งบอกว่าความแปรปรวนของข้อผิดพลาดคงที่ ในขณะที่ Heteroscedasticity บ่งบอกว่าความแปรปรวนของข้อผิดพลาดไม่คงที่

ดู: Heteroskedasticity

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *