การทำให้เป็นมาตรฐานหรือการทำให้เป็นมาตรฐาน: อะไรคือความแตกต่าง?
การทำให้เป็นมาตรฐาน และ การทำให้เป็นมาตรฐาน เป็นสองวิธีในการปรับขนาดข้อมูล
การทำให้เป็นมาตรฐาน จะปรับขนาดชุดข้อมูลให้มีค่าเฉลี่ย 0 และค่าเบี่ยงเบนมาตรฐานเป็น 1 เมื่อต้องการทำเช่นนี้ จะใช้สูตรต่อไปนี้:
x ใหม่ = (x i – x ) / s
ทอง:
- x i : ค่า ที่ i ของชุดข้อมูล
- x : หมายถึงตัวอย่าง
- s : ค่าเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่าง
การทำให้เป็นมาตรฐาน จะปรับขนาดชุดข้อมูลเพื่อให้แต่ละค่าอยู่ระหว่าง 0 ถึง 1 ซึ่งทำได้โดยใช้สูตรต่อไปนี้:
x ใหม่ = (x i – x นาที ) / (x สูงสุด – x นาที )
ทอง:
- x i : ค่า ที่ i ของชุดข้อมูล
- x min : ค่าต่ำสุดในชุดข้อมูล
- x max : ค่าสูงสุดในชุดข้อมูล
ตัวอย่างต่อไปนี้แสดงวิธีการสร้างมาตรฐานและทำให้ชุดข้อมูลเป็นมาตรฐานในทางปฏิบัติ
ตัวอย่าง: วิธีสร้างมาตรฐานข้อมูล
สมมติว่าเรามีชุดข้อมูลต่อไปนี้:

ค่าเฉลี่ยในชุดข้อมูลคือ 43.15 และส่วนเบี่ยงเบนมาตรฐานคือ 22.13
เพื่อทำให้ค่าแรกของ 13 เป็นมาตรฐาน เราจะใช้สูตรที่แชร์ก่อนหน้านี้:
- x ใหม่ = (x ผม – x ) / s = (13 – 43.15) / 22.13 = -1.36
หากต้องการทำให้ค่าที่สองเป็น 16 ให้เป็นปกติ เราจะใช้สูตรเดียวกัน:
- x ใหม่ = (x ผม – x ) / s = (16 – 43.15) / 22.13 = -1.23
หากต้องการทำให้ค่าที่สามของ 19 เป็นมาตรฐาน เราจะใช้สูตรเดียวกัน:
- x ใหม่ = (x ผม – x ) / s = (19 – 43.15) / 22.13 = -1.09
เราสามารถใช้สูตรเดียวกันนี้เพื่อสร้างมาตรฐานให้กับแต่ละค่าในชุดข้อมูลดั้งเดิม:

ตัวอย่าง: วิธีทำให้ข้อมูลเป็นมาตรฐาน
อีกครั้ง สมมติว่าเรามีชุดข้อมูลต่อไปนี้:

ค่าต่ำสุดในชุดข้อมูลคือ 13 และค่าสูงสุดคือ 71
เพื่อทำให้ค่าแรกของ 13 เป็นมาตรฐาน เราจะใช้สูตรที่แชร์ก่อนหน้านี้:
- x ใหม่ = (x i – x นาที ) / (x สูงสุด – x นาที ) = (13 – 13) / (71 – 13) = 0
หากต้องการทำให้ค่าที่สองเป็น 16 ให้เป็นปกติ เราจะใช้สูตรเดียวกัน:
- x ใหม่ = (x i – x นาที ) / (x สูงสุด – x นาที ) = (16 – 13) / (71 – 13) = 0.0517
หากต้องการทำให้ค่าที่สามของ 19 เป็นมาตรฐาน เราจะใช้สูตรเดียวกัน:
- x ใหม่ = (x i – x นาที ) / (x สูงสุด – x นาที ) = (19 – 13) / (71 – 13) = 0.1034
เราสามารถใช้สูตรเดียวกันนี้เพื่อทำให้แต่ละค่าในชุดข้อมูลดั้งเดิมเป็นมาตรฐานระหว่าง 0 ถึง 1:

การทำให้เป็นมาตรฐานหรือการทำให้เป็นมาตรฐาน: ควรใช้เมื่อใด?
โดยทั่วไป เราจะทำให้ข้อมูล เป็นมาตรฐาน เมื่อเราทำการวิเคราะห์บางประเภทโดยที่เรามีตัวแปรหลายตัวที่วัดในระดับที่แตกต่างกัน และเราต้องการให้ตัวแปรแต่ละตัวมีช่วงเดียวกัน
วิธีนี้จะป้องกันไม่ให้ตัวแปรตัวหนึ่งมีอิทธิพลเกินควร โดยเฉพาะอย่างยิ่งหากมีการวัดในหน่วยที่แตกต่างกัน (เช่น หากตัวแปรตัวหนึ่งวัดเป็นนิ้วและอีกตัววัดเป็นหลา)
ในทางกลับกัน โดยทั่วไปเรา จะทำให้ข้อมูลเป็นมาตรฐาน เมื่อเราต้องการทราบว่าแต่ละค่าในชุดข้อมูลมาจากค่าเฉลี่ยเป็นจำนวนเท่าใด
เช่น เราอาจมีรายการคะแนนสอบของนักเรียน 500 คนในโรงเรียนแห่งหนึ่ง และเราอยากทราบว่าคะแนนสอบแต่ละคะแนนมาจากคะแนนเฉลี่ยเป็นจำนวนเท่าใด
ในกรณีนี้ เราสามารถทำให้ข้อมูลดิบเป็นมาตรฐานเพื่อให้ทราบข้อมูลนี้ได้ จากนั้นคะแนนมาตรฐาน 1.26 จะบอกเราว่าคะแนนสอบของนักเรียนคนนี้คือ 1.26 ส่วนเบี่ยงเบนมาตรฐาน ซึ่งสูงกว่าคะแนนสอบเฉลี่ย
ไม่ว่าคุณจะตัดสินใจทำให้ข้อมูลของคุณเป็นมาตรฐานหรือเป็นมาตรฐาน โปรดคำนึงถึงประเด็นต่อไปนี้:
- ชุดข้อมูลที่ทำให้เป็นมาตรฐาน จะมีค่าระหว่าง 0 ถึง 1 เสมอ
- ชุดข้อมูลมาตรฐาน จะมีค่าเฉลี่ยเป็น 0 และส่วนเบี่ยงเบนมาตรฐานเป็น 1 แต่ไม่มีขีดจำกัดบนหรือล่างเฉพาะสำหรับค่าสูงสุดและต่ำสุด
ขึ้นอยู่กับสถานการณ์เฉพาะของคุณ การทำให้ข้อมูลเป็นมาตรฐานหรือเป็นมาตรฐานอาจเหมาะสมกว่า
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้จะอธิบายวิธีสร้างมาตรฐานและทำให้ข้อมูลเป็นมาตรฐานในซอฟต์แวร์ทางสถิติต่างๆ:
วิธีทำให้ข้อมูลเป็นมาตรฐานใน R
วิธีทำให้ข้อมูลเป็นมาตรฐานใน Excel
วิธีทำให้ข้อมูลเป็นมาตรฐานใน Python
วิธีสร้างมาตรฐานข้อมูลใน R