ค่าสัมประสิทธิ์การถดถอยที่เป็นมาตรฐานและไม่เป็นมาตรฐาน
การถดถอยเชิงเส้นพหุคูณ เป็นวิธีที่มีประโยชน์ในการหาปริมาณความสัมพันธ์ระหว่างตัวแปรทำนายตั้งแต่สองตัวขึ้นไปกับ ตัวแปรตอบสนอง
โดยทั่วไป เมื่อเราทำการถดถอยเชิงเส้นหลายครั้ง ค่าสัมประสิทธิ์การถดถอยที่เกิดขึ้นจะ ไม่ได้มาตรฐาน ซึ่งหมายความว่าพวกมันจะใช้ข้อมูลดิบเพื่อค้นหาเส้นที่เหมาะสมที่สุด
อย่างไรก็ตาม เมื่อมีการวัดตัวแปรทำนายด้วยสเกลที่ต่างกันอย่างสิ้นเชิง อาจเป็นประโยชน์ในการทำการถดถอยเชิงเส้นพหุคูณโดยใช้ข้อมูลที่เป็นมาตรฐาน ซึ่งส่งผลให้เกิดค่าสัมประสิทธิ์ ที่เป็นมาตรฐาน
เพื่อช่วยให้คุณเข้าใจแนวคิดนี้ เราจะมาดูตัวอย่างง่ายๆ กัน
ตัวอย่าง: ค่าสัมประสิทธิ์การถดถอยที่เป็นมาตรฐานและไม่เป็นมาตรฐาน
สมมติว่าเรามีชุดข้อมูลต่อไปนี้ซึ่งมีข้อมูลเกี่ยวกับอายุ พื้นที่เป็นตารางฟุต และราคาขายของบ้าน 12 หลัง:
สมมติว่าเราทำการถดถอยเชิงเส้นพหุคูณ โดยใช้ อายุ และ พื้นที่เป็นตารางฟุต เป็นตัวแปรทำนาย และ ราคา เป็นตัวแปรตอบสนอง
นี่คือ ผลลัพธ์ของการถดถอย :
ค่าสัมประสิทธิ์การถดถอยในตารางนี้ ไม่ได้กำหนดมาตรฐาน ซึ่งหมายความว่าค่าสัมประสิทธิ์จะใช้ข้อมูลดิบเพื่อให้พอดีกับแบบจำลองการถดถอยนี้ เมื่อมองแวบแรก ดูเหมือนว่า อายุ จะส่งผลต่อราคาอสังหาริมทรัพย์มากกว่ามาก เนื่องจากค่าสัมประสิทธิ์ในตารางการถดถอยคือ -409.833 เทียบกับเพียง 100.866 สำหรับ ตารางฟุต ตัวแปรตัวทำนาย
อย่างไรก็ตาม ข้อผิดพลาดมาตรฐานนั้นมีขนาดใหญ่กว่าสำหรับอายุมากกว่าสำหรับพื้นที่เป็นตารางฟุต ซึ่งเป็นเหตุผลว่าทำไมค่า p ที่สอดคล้องกันจึงมีขนาดใหญ่สำหรับอายุ (p = 0.520) และมีค่าน้อยสำหรับพื้นที่เป็นตารางฟุต (p = 0.000)
สาเหตุของความแตกต่างอย่างมากในค่าสัมประสิทธิ์การถดถอยนั้นเนื่องมาจากความแตกต่างอย่างมากในระดับของตัวแปรทั้งสอง:
- ค่าสำหรับ ช่วงอายุ ตั้งแต่ 4 ถึง 44 ปี
- ค่า พื้นที่เป็นตารางฟุต อยู่ระหว่าง 1,200 ถึง 2,800
สมมติว่าเราทำให้ข้อมูลดิบต้นฉบับ เป็นมาตรฐาน แทนโดยการแปลงค่าข้อมูลต้นฉบับแต่ละค่าเป็นคะแนน z:
หากเราทำการถดถอยเชิงเส้นพหุคูณโดยใช้ข้อมูลมาตรฐาน เราจะได้ผลลัพธ์การถดถอยดังต่อไปนี้:
ค่าสัมประสิทธิ์การถดถอยในตารางนี้เป็น ค่ามาตรฐาน ซึ่งหมายความว่าค่าสัมประสิทธิ์นี้ใช้ข้อมูลที่เป็นมาตรฐานเพื่อให้พอดีกับโมเดลการถดถอยนี้ วิธีการตีความค่าสัมประสิทธิ์ในตารางมีดังนี้:
- อายุ ที่เพิ่มขึ้นหนึ่งส่วนเบี่ยงเบนมาตรฐานสัมพันธ์กับราคาบ้านที่ลดลง 0.092 ส่วนเบี่ยงเบนมาตรฐาน โดยสมมติว่าพื้นที่เป็นตารางฟุตคงที่
- การเพิ่มขึ้น ของค่าเบี่ยงเบนมาตรฐานหนึ่งหน่วยเป็นตารางฟุต สัมพันธ์กับการเพิ่มขึ้นของค่าเบี่ยงเบนมาตรฐาน 0.885 ในราคาบ้าน โดยสมมติว่าอายุคงที่
เราจะเห็นได้ทันทีว่าพื้นที่เป็นตารางฟุตมีผลกระทบต่อราคาอสังหาริมทรัพย์มากกว่าอายุมาก โปรดทราบว่าค่า p สำหรับตัวแปรทำนายแต่ละตัวจะเหมือนกันทุกประการกับค่าในแบบจำลองการถดถอยก่อนหน้า
ที่เกี่ยวข้อง: วิธีคำนวณคะแนน Z ใน Excel
เมื่อใดควรใช้สัมประสิทธิ์การถดถอยที่เป็นมาตรฐานหรือไม่เป็นมาตรฐาน
ค่าสัมประสิทธิ์การถดถอยทั้งแบบมาตรฐานและไม่เป็นมาตรฐานจะมีประโยชน์ขึ้นอยู่กับสถานการณ์ โดยเฉพาะ:
ค่าสัมประสิทธิ์การถดถอยที่ไม่ได้มาตรฐาน มีประโยชน์เมื่อคุณต้องการตีความผลกระทบที่การเปลี่ยนแปลงหนึ่งหน่วยในตัวแปรทำนายมีต่อตัวแปรตอบสนอง ในตัวอย่างข้างต้น เราสามารถใช้ค่าสัมประสิทธิ์การถดถอยที่ไม่ได้มาตรฐานจากการถดถอยครั้งแรกเพื่อทำความเข้าใจความสัมพันธ์ที่แน่นอนระหว่างตัวแปรทำนายและตัวแปรตอบสนอง:
- อายุที่เพิ่มขึ้นหนึ่งยูนิตสัมพันธ์กับราคาบ้านที่ลดลงโดยเฉลี่ย 409 ดอลลาร์ โดยสมมติว่าพื้นที่เป็นตารางฟุตคงที่ สัมประสิทธิ์นี้ไม่มีนัยสำคัญทางสถิติ (p=0.520)
- การเพิ่มขึ้นของหนึ่งหน่วยเป็นตารางฟุตสัมพันธ์กับราคาบ้านที่เพิ่มขึ้นโดยเฉลี่ย 100 ดอลลาร์ โดยสมมติว่าอายุคงที่ สัมประสิทธิ์นี้มีนัยสำคัญทางสถิติ (p=0.000)
ค่าสัมประสิทธิ์การถดถอยมาตรฐาน มีประโยชน์เมื่อคุณต้องการเปรียบเทียบผลกระทบของตัวแปรทำนายที่แตกต่างกันกับตัวแปรตอบสนอง เนื่องจากตัวแปรแต่ละตัวมีการกำหนดมาตรฐาน คุณจึงสามารถดูได้ว่าตัวแปรตัวใดมีผลกระทบต่อตัวแปรตอบสนอง มากที่สุด
ข้อเสียของสัมประสิทธิ์การถดถอยมาตรฐานคือ พวกมันตีความได้ยากกว่าเล็กน้อย ตัวอย่างเช่น จะง่ายกว่าที่จะเข้าใจผลกระทบของการเพิ่มขึ้นของอายุหนึ่งหน่วยต่อราคาอสังหาริมทรัพย์มากกว่าผลกระทบของการเพิ่มขึ้นของค่าเบี่ยงเบนมาตรฐานหนึ่งค่าต่อราคาอสังหาริมทรัพย์
แหล่งข้อมูลเพิ่มเติม
วิธีอ่านและตีความตารางการถดถอย
วิธีการตีความค่าสัมประสิทธิ์การถดถอย
วิธีการดำเนินการถดถอยเชิงเส้นหลายรายการใน Excel