วิธีดำเนินการทดสอบของ white ใน sas


การทดสอบของ White ใช้เพื่อพิจารณาว่า มีความต่างกัน ในแบบจำลองการถดถอยหรือไม่

ความต่างกันหมายถึงการกระจายตัวของ สารตกค้าง ที่ไม่สม่ำเสมอในระดับต่างๆ ของ ตัวแปรการตอบสนอง ในแบบจำลองการถดถอย ซึ่งฝ่าฝืน ข้อสันนิษฐานหลักข้อหนึ่งของการถดถอยเชิงเส้น ที่ว่าสารตกค้างจะกระจายเท่ากันในแต่ละระดับของตัวแปรตอบสนอง

บทช่วยสอนนี้จะอธิบายวิธีดำเนินการทดสอบ White ใน SAS เพื่อพิจารณาว่าความต่างกันเป็นปัญหาในแบบจำลองการถดถอยที่กำหนดหรือไม่

ตัวอย่าง: การทดสอบสีขาวใน SAS

สมมติว่าเราต้องการใช้แบบจำลองการถดถอยเชิงเส้นพหุคูณที่ใช้จำนวนชั่วโมงในการเรียนและจำนวนข้อสอบฝึกหัดเพื่อทำนายคะแนนสอบปลายภาคของนักเรียน:

คะแนนสอบ = β 0 + β 1 (ชั่วโมง) + β 2 (ข้อสอบเตรียมอุดมศึกษา)

ขั้นแรก เราจะใช้โค้ดต่อไปนี้เพื่อสร้างชุดข้อมูลที่มีข้อมูลนี้สำหรับนักเรียน 20 คน:

 /*create dataset*/
data exam_data;
    input hours prep_exams score;
    datalines ;
1 1 76
2 3 78
2 3 85
4 5 88
2 2 72
1 2 69
5 1 94
4 1 94
2 0 88
4 3 92
4 4 90
3 3 75
6 2 90
5 4 90
3 4 82
4 4 85
6 5 90
2 1 83
1 0 62
2 1 76
;
run ;

/*view dataset*/
proc print data =exam_data; 

ต่อไป เราจะใช้ proc reg เพื่อให้พอดีกับโมเดลการถดถอยเชิงเส้นพหุคูณนี้ รวมถึงตัวเลือก ข้อมูลจำเพาะ เพื่อทำการทดสอบของ White สำหรับความต่างศักย์ไฟฟ้า:

 /*fit regression model and perform White's test*/
proc reg data =exam_data;
    model score = hours prep_exams / spec ;
run ;
quit ; 

การทดสอบสีขาวใน SAS

ตารางผลลัพธ์สุดท้ายแสดงผลการทดสอบของไวท์

จากตารางนี้ เราจะเห็นว่าสถิติการทดสอบไคสแควร์คือ 3.54 และค่า p ที่สอดคล้องกันคือ 0.6175

การทดสอบสีขาวใช้สมมติฐานว่างและทางเลือกต่อไปนี้:

  • Null (H 0 ) : ไม่มีความแตกต่างแบบ Heteroskedasticity
  • ทางเลือกอื่น ( HA ): มี Heteroskedasticity อยู่

เนื่องจากค่า p ไม่น้อยกว่า 0.05 เราจึงไม่สามารถปฏิเสธสมมติฐานว่างได้

ซึ่งหมายความว่าเราไม่มีหลักฐานเพียงพอที่จะอ้างว่ามีความต่างกันในแบบจำลองการถดถอย

ดังนั้นจึงเป็นไปได้ที่จะตีความข้อผิดพลาดมาตรฐานของการประมาณค่าสัมประสิทธิ์ได้อย่างปลอดภัยในตารางสรุปการถดถอย

จะทำอย่างไรต่อไป

หากคุณล้มเหลวในการปฏิเสธสมมติฐานว่างของการทดสอบของไวท์ ก็จะไม่มีภาวะเฮเทอโรสซีดาสติก และคุณสามารถตีความผลลัพธ์ของการถดถอยดั้งเดิมต่อไปได้

อย่างไรก็ตาม หากคุณปฏิเสธสมมติฐานว่าง นั่นหมายความว่าข้อมูลมีความต่างกันออกไป ในกรณีนี้ ข้อผิดพลาดมาตรฐานที่แสดงในตารางผลลัพธ์การถดถอยอาจไม่น่าเชื่อถือ

มีวิธีทั่วไปหลายวิธีในการแก้ไขปัญหานี้ ได้แก่:

1. แปลงตัวแปรการตอบสนอง คุณสามารถลองทำการแปลงตัวแปรตอบสนองได้

ตัวอย่างเช่น คุณสามารถใช้ตัวแปรตอบกลับของบันทึกแทนตัวแปรตอบกลับดั้งเดิมได้

โดยทั่วไป การเก็บบันทึกของตัวแปรตอบสนองเป็นวิธีที่มีประสิทธิภาพในการทำให้ความต่างกันหายไป

การแปลงทั่วไปอีกอย่างหนึ่งคือการใช้รากที่สองของตัวแปรตอบสนอง

2. ใช้การถดถอยแบบถ่วงน้ำหนัก การถดถอยประเภทนี้จะกำหนดน้ำหนักให้กับจุดข้อมูลแต่ละจุดโดยพิจารณาจากความแปรปรวนของค่าที่พอดี

ซึ่งจะให้น้ำหนักเล็กน้อยแก่จุดข้อมูลที่มีความแปรปรวนสูงกว่า ช่วยลดกำลังสองที่เหลือ

เมื่อใช้ตุ้มน้ำหนักที่เหมาะสม สิ่งนี้สามารถขจัดปัญหาความไม่สมดุลได้

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *