Y hat ในสถิติคืออะไร?


ในสถิติ คำว่า y hat (เขียนว่า ŷ ) หมายถึงค่าประมาณของตัวแปรตอบสนองใน แบบจำลองการถดถอยเชิงเส้น

โดยทั่วไปเราจะเขียนสมการการถดถอยโดยประมาณดังนี้:

ŷ = β 0 + β 1 x

ทอง:

  • ŷ : ค่าประมาณของตัวแปรตอบสนอง
  • β 0 : ค่าเฉลี่ยของตัวแปรตอบสนองเมื่อตัวแปรทำนายเป็นศูนย์
  • β 1 : การเปลี่ยนแปลงโดยเฉลี่ยในตัวแปรตอบสนองที่เกี่ยวข้องกับการเพิ่มขึ้นหนึ่งหน่วยในตัวแปรทำนาย

ตัวอย่างเช่น สมมติว่าเรามีชุดข้อมูลต่อไปนี้ที่แสดงจำนวนชั่วโมงที่นักเรียน 6 คนเรียนพร้อมคะแนนสอบปลายภาค:

สมมติว่าเราใช้ซอฟต์แวร์ทางสถิติ (เช่น R , Excel , Python หรือแม้แต่ด้วยตนเอง) เพื่อให้เหมาะสมกับแบบจำลองการถดถอยต่อไปนี้ โดยใช้ ชั่วโมงที่ศึกษา เป็นตัวแปรทำนาย และ ตรวจสอบผลลัพธ์ เป็นตัวแปรตอบสนอง:

คะแนน = 66.615 + 5.0769*(ชั่วโมง)

วิธีการตีความค่าสัมประสิทธิ์การถดถอยในแบบจำลองนี้มีดังต่อไปนี้:

  • คะแนนสอบเฉลี่ยของนักเรียนที่เรียนเป็นศูนย์ชั่วโมงคือ 66,615
  • คะแนนสอบเพิ่มขึ้นเฉลี่ย 5.0769 คะแนนสำหรับแต่ละชั่วโมงที่เรียนเพิ่มเติม

เราสามารถใช้สมการการถดถอยนี้เพื่อ ประมาณ คะแนนของนักเรียนตามจำนวนชั่วโมงที่เรียน

เช่น นักเรียนที่เรียน 3 ชั่วโมง ควรได้คะแนนดังนี้

คะแนน = 66.615 + 5.0769*(3) = 81.85

ทำไมวายแฮทถึงใช้?

สัญลักษณ์ “หมวก” ในสถิติใช้เพื่อแสดงถึงคำ “ประมาณการ” ใดๆ ตัวอย่างเช่น ŷ ถูกใช้เพื่อแสดงตัวแปรการตอบสนองโดยประมาณ

โดยทั่วไป เมื่อเราปรับโมเดลการถดถอยเชิงเส้นให้เหมาะสม เราจะใช้ ตัวอย่าง ข้อมูลจากประชากร เนื่องจากสะดวกกว่าและใช้เวลาน้อยกว่าการรวบรวมข้อมูลสำหรับการสังเกตทุกครั้งที่เป็นไปได้ในประชากร

ดังนั้นเมื่อเราพบสมการการถดถอย เราจะเพียง ประมาณ ความสัมพันธ์ที่แท้จริงระหว่างตัวแปรทำนายและตัวแปรตอบสนองเท่านั้น

นี่คือสาเหตุที่เราใช้คำว่า ŷ ในสมการถดถอยแทน y

แหล่งข้อมูลเพิ่มเติม

รู้เบื้องต้นเกี่ยวกับการถดถอยเชิงเส้นอย่างง่าย
รู้เบื้องต้นเกี่ยวกับการถดถอยเชิงเส้นพหุคูณ
ความรู้เบื้องต้นเกี่ยวกับตัวแปรอธิบายและการตอบสนอง

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *