Y hat ในสถิติคืออะไร?
ในสถิติ คำว่า y hat (เขียนว่า ŷ ) หมายถึงค่าประมาณของตัวแปรตอบสนองใน แบบจำลองการถดถอยเชิงเส้น
โดยทั่วไปเราจะเขียนสมการการถดถอยโดยประมาณดังนี้:
ŷ = β 0 + β 1 x
ทอง:
- ŷ : ค่าประมาณของตัวแปรตอบสนอง
- β 0 : ค่าเฉลี่ยของตัวแปรตอบสนองเมื่อตัวแปรทำนายเป็นศูนย์
- β 1 : การเปลี่ยนแปลงโดยเฉลี่ยในตัวแปรตอบสนองที่เกี่ยวข้องกับการเพิ่มขึ้นหนึ่งหน่วยในตัวแปรทำนาย
ตัวอย่างเช่น สมมติว่าเรามีชุดข้อมูลต่อไปนี้ที่แสดงจำนวนชั่วโมงที่นักเรียน 6 คนเรียนพร้อมคะแนนสอบปลายภาค:
สมมติว่าเราใช้ซอฟต์แวร์ทางสถิติ (เช่น R , Excel , Python หรือแม้แต่ด้วยตนเอง) เพื่อให้เหมาะสมกับแบบจำลองการถดถอยต่อไปนี้ โดยใช้ ชั่วโมงที่ศึกษา เป็นตัวแปรทำนาย และ ตรวจสอบผลลัพธ์ เป็นตัวแปรตอบสนอง:
คะแนน = 66.615 + 5.0769*(ชั่วโมง)
วิธีการตีความค่าสัมประสิทธิ์การถดถอยในแบบจำลองนี้มีดังต่อไปนี้:
- คะแนนสอบเฉลี่ยของนักเรียนที่เรียนเป็นศูนย์ชั่วโมงคือ 66,615
- คะแนนสอบเพิ่มขึ้นเฉลี่ย 5.0769 คะแนนสำหรับแต่ละชั่วโมงที่เรียนเพิ่มเติม
เราสามารถใช้สมการการถดถอยนี้เพื่อ ประมาณ คะแนนของนักเรียนตามจำนวนชั่วโมงที่เรียน
เช่น นักเรียนที่เรียน 3 ชั่วโมง ควรได้คะแนนดังนี้
คะแนน = 66.615 + 5.0769*(3) = 81.85
ทำไมวายแฮทถึงใช้?
สัญลักษณ์ “หมวก” ในสถิติใช้เพื่อแสดงถึงคำ “ประมาณการ” ใดๆ ตัวอย่างเช่น ŷ ถูกใช้เพื่อแสดงตัวแปรการตอบสนองโดยประมาณ
โดยทั่วไป เมื่อเราปรับโมเดลการถดถอยเชิงเส้นให้เหมาะสม เราจะใช้ ตัวอย่าง ข้อมูลจากประชากร เนื่องจากสะดวกกว่าและใช้เวลาน้อยกว่าการรวบรวมข้อมูลสำหรับการสังเกตทุกครั้งที่เป็นไปได้ในประชากร
ดังนั้นเมื่อเราพบสมการการถดถอย เราจะเพียง ประมาณ ความสัมพันธ์ที่แท้จริงระหว่างตัวแปรทำนายและตัวแปรตอบสนองเท่านั้น
นี่คือสาเหตุที่เราใช้คำว่า ŷ ในสมการถดถอยแทน y
แหล่งข้อมูลเพิ่มเติม
รู้เบื้องต้นเกี่ยวกับการถดถอยเชิงเส้นอย่างง่าย
รู้เบื้องต้นเกี่ยวกับการถดถอยเชิงเส้นพหุคูณ
ความรู้เบื้องต้นเกี่ยวกับตัวแปรอธิบายและการตอบสนอง