การแก้ไขหรือการประมาณค่า: อะไรคือความแตกต่าง?
คำสองคำที่นักเรียนมักสับสนในสถิติคือ การประมาณค่า และ การประมาณค่า
นี่คือความแตกต่าง:
การประมาณค่า หมายถึงการทำนายค่าที่อยู่ ภายใน ช่วงของจุดข้อมูล
การประมาณค่า หมายถึงการทำนายค่าที่อยู่ นอก ช่วงจุดข้อมูล
ตัวอย่างต่อไปนี้แสดงให้เห็นถึงความแตกต่างระหว่างคำสองคำนี้
ตัวอย่าง: การประมาณค่าและการประมาณค่า
สมมติว่าเรามีชุดข้อมูลต่อไปนี้:

เราสามารถตัดสินใจได้ว่าจะนำ โมเดลการถดถอยเชิงเส้นอย่างง่าย มาใช้กับจุดเหล่านี้:

จากนั้นเราสามารถใช้แบบจำลองการถดถอยที่ติดตั้งไว้เพื่อทำนายค่าจุดทั้ง ภายใน และ ภายนอก ช่วงของจุดข้อมูล
เมื่อเราใช้โมเดลการถดถอยแบบพอดีเพื่อทำนายค่าจุดภายในช่วงจุดข้อมูลที่มีอยู่ จะเรียกว่า การประมาณค่า
ในทางกลับกัน เมื่อเราใช้แบบจำลองการถดถอยแบบพอดีเพื่อทำนายค่าจุดที่อยู่นอกช่วงที่มีอยู่ จะเรียกว่า การประมาณค่า :

อันตรายที่อาจเกิดขึ้นจากการคาดการณ์
เมื่อเราคาดการณ์ เราจะถือว่ารูปแบบเดียวกันที่มีอยู่ภายในช่วงจุดข้อมูลปัจจุบันก็มีอยู่นอกช่วงเช่นกัน
อย่างไรก็ตาม นี่อาจเป็นสมมติฐานที่เป็นอันตราย เนื่องจากเป็นไปได้ว่ารูปแบบที่มีอยู่นอกช่วงจุดข้อมูลปัจจุบันจะแตกต่างกันมาก:

ด้วยเหตุนี้ การใช้การประมาณค่าเพื่อคาดการณ์ค่าจุดข้อมูลที่อยู่นอกช่วงของค่าที่ใช้สร้างโมเดลการถดถอยจึงอาจเป็นอันตรายได้
ในทางปฏิบัติ มักจะสมเหตุสมผลที่จะใช้การประมาณค่าเพื่อทำนายค่าจุดที่อยู่นอกช่วงของค่าที่มีอยู่เล็กน้อย แต่ยิ่งห่างจากช่วงที่ไปมากเท่าใดก็ยิ่งมีโอกาสมากขึ้นที่ความแตกต่างระหว่างค่าที่คาดการณ์กับค่าจริง คุณค่าเป็นสิ่งสำคัญ .
เมื่อใดควรใช้การประมาณค่า
มักจะต้องใช้ความเชี่ยวชาญเฉพาะโดเมนเพื่อพิจารณาว่าการคาดการณ์นั้นเป็นแนวคิดที่สมเหตุสมผลหรือไม่
ตัวอย่างเช่น สมมติว่าแผนกการตลาดของบริษัทใช้แบบจำลองการถดถอยเชิงเส้นอย่างง่ายโดยใช้การใช้จ่ายด้านการโฆษณาเป็นตัวแปรทำนาย และใช้รายได้ทั้งหมดเป็นตัวแปรตอบสนอง
ในสถานการณ์นี้ อาจสมเหตุสมผลที่จะถือว่าการใช้จ่ายด้านการโฆษณาที่เพิ่มขึ้นอย่างต่อเนื่องจะส่งผลให้รายได้รวมเพิ่มขึ้นที่คาดการณ์ได้:

ในสถานการณ์นี้ เราค่อนข้างมั่นใจในความสามารถของเราในการประมาณค่าต่างๆ
อย่างไรก็ตาม ให้พิจารณาสถานการณ์ที่นักชีววิทยาต้องการใช้ปุ๋ยทั้งหมดเพื่อทำนายการเจริญเติบโตของพืช
เธออาจตัดสินใจที่จะใส่แบบจำลองการถดถอยเชิงเส้นอย่างง่ายกับจุดข้อมูล แต่เนื่องจากมีขีดจำกัดบนสำหรับความสูงของพืช จึงอาจไม่สมเหตุสมผลที่จะใช้การประมาณค่าเพื่อทำนายค่าจุด อยู่นอกช่วงค่า ค่าที่ใช้ให้พอดีกับโมเดล:

ในสถานการณ์นี้ เราอาจมีความมั่นใจน้อยลงมากในความสามารถของเราในการประมาณค่าต่างๆ
ประเด็นสำคัญ : การประมาณค่านอกชายฝั่งอาจสมเหตุสมผลในบางพื้นที่มากกว่าที่อื่น แต่ก็มีอันตรายอยู่เสมอที่แบบจำลองซึ่งอยู่ในช่วงค่าที่ใช้เพื่อให้พอดีกับแบบจำลองนั้นไม่มีอยู่นอกชายหาด