วิธีดำเนินการทดสอบของ white ใน sas
การทดสอบของ White ใช้เพื่อพิจารณาว่า มีความต่างกัน ในแบบจำลองการถดถอยหรือไม่
ความต่างกันหมายถึงการกระจายตัวของ สารตกค้าง ที่ไม่สม่ำเสมอในระดับต่างๆ ของ ตัวแปรการตอบสนอง ในแบบจำลองการถดถอย ซึ่งฝ่าฝืน ข้อสันนิษฐานหลักข้อหนึ่งของการถดถอยเชิงเส้น ที่ว่าสารตกค้างจะกระจายเท่ากันในแต่ละระดับของตัวแปรตอบสนอง
บทช่วยสอนนี้จะอธิบายวิธีดำเนินการทดสอบ White ใน SAS เพื่อพิจารณาว่าความต่างกันเป็นปัญหาในแบบจำลองการถดถอยที่กำหนดหรือไม่
ตัวอย่าง: การทดสอบสีขาวใน SAS
สมมติว่าเราต้องการใช้แบบจำลองการถดถอยเชิงเส้นพหุคูณที่ใช้จำนวนชั่วโมงในการเรียนและจำนวนข้อสอบฝึกหัดเพื่อทำนายคะแนนสอบปลายภาคของนักเรียน:
คะแนนสอบ = β 0 + β 1 (ชั่วโมง) + β 2 (ข้อสอบเตรียมอุดมศึกษา)
ขั้นแรก เราจะใช้โค้ดต่อไปนี้เพื่อสร้างชุดข้อมูลที่มีข้อมูลนี้สำหรับนักเรียน 20 คน:
/*create dataset*/ data exam_data; input hours prep_exams score; datalines ; 1 1 76 2 3 78 2 3 85 4 5 88 2 2 72 1 2 69 5 1 94 4 1 94 2 0 88 4 3 92 4 4 90 3 3 75 6 2 90 5 4 90 3 4 82 4 4 85 6 5 90 2 1 83 1 0 62 2 1 76 ; run ; /*view dataset*/ proc print data =exam_data;

ต่อไป เราจะใช้ proc reg เพื่อให้พอดีกับโมเดลการถดถอยเชิงเส้นพหุคูณนี้ รวมถึงตัวเลือก ข้อมูลจำเพาะ เพื่อทำการทดสอบของ White สำหรับความต่างศักย์ไฟฟ้า:
/*fit regression model and perform White's test*/
proc reg data =exam_data;
model score = hours prep_exams / spec ;
run ;
quit ;

ตารางผลลัพธ์สุดท้ายแสดงผลการทดสอบของไวท์
จากตารางนี้ เราจะเห็นว่าสถิติการทดสอบไคสแควร์คือ 3.54 และค่า p ที่สอดคล้องกันคือ 0.6175
การทดสอบสีขาวใช้สมมติฐานว่างและทางเลือกต่อไปนี้:
- Null (H 0 ) : ไม่มีความแตกต่างแบบ Heteroskedasticity
- ทางเลือกอื่น ( HA ): มี Heteroskedasticity อยู่
เนื่องจากค่า p ไม่น้อยกว่า 0.05 เราจึงไม่สามารถปฏิเสธสมมติฐานว่างได้
ซึ่งหมายความว่าเราไม่มีหลักฐานเพียงพอที่จะอ้างว่ามีความต่างกันในแบบจำลองการถดถอย
ดังนั้นจึงเป็นไปได้ที่จะตีความข้อผิดพลาดมาตรฐานของการประมาณค่าสัมประสิทธิ์ได้อย่างปลอดภัยในตารางสรุปการถดถอย
จะทำอย่างไรต่อไป
หากคุณล้มเหลวในการปฏิเสธสมมติฐานว่างของการทดสอบของไวท์ ก็จะไม่มีภาวะเฮเทอโรสซีดาสติก และคุณสามารถตีความผลลัพธ์ของการถดถอยดั้งเดิมต่อไปได้
อย่างไรก็ตาม หากคุณปฏิเสธสมมติฐานว่าง นั่นหมายความว่าข้อมูลมีความต่างกันออกไป ในกรณีนี้ ข้อผิดพลาดมาตรฐานที่แสดงในตารางผลลัพธ์การถดถอยอาจไม่น่าเชื่อถือ
มีวิธีทั่วไปหลายวิธีในการแก้ไขปัญหานี้ ได้แก่:
1. แปลงตัวแปรการตอบสนอง คุณสามารถลองทำการแปลงตัวแปรตอบสนองได้
ตัวอย่างเช่น คุณสามารถใช้ตัวแปรตอบกลับของบันทึกแทนตัวแปรตอบกลับดั้งเดิมได้
โดยทั่วไป การเก็บบันทึกของตัวแปรตอบสนองเป็นวิธีที่มีประสิทธิภาพในการทำให้ความต่างกันหายไป
การแปลงทั่วไปอีกอย่างหนึ่งคือการใช้รากที่สองของตัวแปรตอบสนอง
2. ใช้การถดถอยแบบถ่วงน้ำหนัก การถดถอยประเภทนี้จะกำหนดน้ำหนักให้กับจุดข้อมูลแต่ละจุดโดยพิจารณาจากความแปรปรวนของค่าที่พอดี
ซึ่งจะให้น้ำหนักเล็กน้อยแก่จุดข้อมูลที่มีความแปรปรวนสูงกว่า ช่วยลดกำลังสองที่เหลือ
เมื่อใช้ตุ้มน้ำหนักที่เหมาะสม สิ่งนี้สามารถขจัดปัญหาความไม่สมดุลได้