วิธีทำให้ข้อมูลเป็นมาตรฐานระหว่าง 0 ถึง 100
หากต้องการทำให้ค่าในชุดข้อมูลเป็นปกติระหว่าง 0 ถึง 100 คุณสามารถใช้สูตรต่อไปนี้:
z i = (x i – นาที(x)) / (สูงสุด(x) – นาที(x)) * 100
ทอง:
- zi : ค่า มาตรฐานในชุดข้อมูล
- x i : ค่า ที่ i ของชุดข้อมูล
- min(x) : ค่าต่ำสุดในชุดข้อมูล
- สูงสุด(x): ค่าสูงสุดในชุดข้อมูล
ตัวอย่างเช่น สมมติว่าเรามีชุดข้อมูลต่อไปนี้:
ค่าต่ำสุดในชุดข้อมูลคือ 12 และค่าสูงสุดคือ 68
หากต้องการทำให้ค่าแรกของ 12 เป็นมาตรฐาน เราจะใช้สูตรที่แชร์ก่อนหน้านี้:
- z i = (x i – นาที(x)) / (สูงสุด(x) – นาที(x)) * 100 = (12 – 12) / (68 – 12) * 100 = 0
หากต้องการทำให้ค่าที่สองเป็น 19 ให้เป็นมาตรฐาน เราจะใช้สูตรเดียวกัน:
- z i = (x i – นาที(x)) / (สูงสุด(x) – นาที(x)) * 100 = (19 – 12) / (68 – 12) * 100 = 12.5
หากต้องการทำให้ค่าที่สามของ 21 เป็นมาตรฐาน เราจะใช้สูตรเดียวกัน:
- z i = (x i – นาที(x)) / (สูงสุด(x) – นาที(x)) * 100 = (21 – 12) / (68 – 12) * 100 = 16.07
เราสามารถใช้สูตรเดียวกันนี้เพื่อทำให้แต่ละค่าในชุดข้อมูลเดิมเป็นมาตรฐานระหว่าง 0 ถึง 100:
วิธีทำให้ข้อมูลเป็นมาตรฐานระหว่างช่วงใดก็ได้
จริงๆ แล้ว เราสามารถใช้สูตรนี้เพื่อทำให้ชุดข้อมูลระหว่าง 0 ถึงตัวเลขใดๆ เป็นมาตรฐาน:
z i = (x i – min(x)) / (สูงสุด(x) – min(x)) * Q
โดยที่ Q คือจำนวนสูงสุดที่ต้องการสำหรับค่าข้อมูลที่ทำให้เป็นมาตรฐานของคุณ
ในตัวอย่างก่อนหน้านี้ เราเลือก Q เป็น 100 แต่เราสามารถปรับช่วงของค่าข้อมูลระหว่าง 0 ถึง 1,000 ให้เป็นมาตรฐานได้อย่างง่ายดายโดยการเลือก Q เป็น 1,000:
หากต้องการทำให้ค่าแรกของ 12 เป็นมาตรฐาน เราจะใช้สูตร:
- z i = (x i – นาที(x)) / (สูงสุด(x) – นาที(x)) * 1000 = (12 – 12) / (68 – 12) * 100 = 0
หากต้องการทำให้ค่าที่สองเป็น 19 ให้เป็นมาตรฐาน เราจะใช้สูตรเดียวกัน:
- z i = (x i – นาที(x)) / (สูงสุด(x) – นาที(x)) * 1000 = (19 – 12) / (68 – 12) * 100 = 125
หากต้องการทำให้ค่าที่สามของ 21 เป็นมาตรฐาน เราจะใช้สูตรเดียวกัน:
- z i = (x i – นาที(x)) / (สูงสุด(x) – นาที(x)) * 1,000 = (21 – 12) / (68 – 12) * 100 = 160.7
เราสามารถใช้สูตรเดียวกันนี้เพื่อทำให้แต่ละค่าในชุดข้อมูลดั้งเดิมเป็นมาตรฐานระหว่าง 0 ถึง 1,000:
เมื่อใดที่ต้องทำให้ข้อมูลเป็นมาตรฐาน
บางครั้งเราสร้างมาตรฐานให้กับตัวแปรเมื่อเราทำการวิเคราะห์บางประเภทโดยที่เรามีตัวแปรหลายตัวที่วัดในระดับที่แตกต่างกัน และเราต้องการให้ตัวแปรแต่ละตัวมีช่วงเดียวกัน
วิธีนี้จะป้องกันไม่ให้ตัวแปรตัวหนึ่งมีอิทธิพลเกินควร โดยเฉพาะอย่างยิ่งหากมีการวัดในหน่วยที่แตกต่างกัน (เช่น หากตัวแปรตัวหนึ่งวัดเป็นนิ้วและอีกตัววัดเป็นหลา)
นอกจากนี้ ยังเป็นที่น่าสังเกตว่าเราใช้วิธีที่เรียกว่า การทำให้เป็นมาตรฐานขั้นต่ำ-สูงสุด ในบทช่วยสอนนี้เพื่อทำให้ค่าข้อมูลเป็นมาตรฐาน
วิธีการทำให้เป็นมาตรฐานสองวิธีที่พบบ่อยที่สุดคือ:
1. การทำให้เป็นมาตรฐานขั้นต่ำ-สูงสุด
- วัตถุประสงค์: แปลงค่าข้อมูลแต่ละค่าให้เป็นค่าระหว่าง 0 ถึง 100
- สูตร: ค่าใหม่ = (ค่า – นาที) / (สูงสุด – นาที) * 100
2. การทำให้เป็นมาตรฐานโดยเฉลี่ย
- วัตถุประสงค์: ปรับขนาดค่าโดยให้ค่าเฉลี่ยของค่าทั้งหมดเป็น 0 และมาตรฐาน ผู้พัฒนา คือ 1
- สูตร: ค่าใหม่ = (ค่า – ค่าเฉลี่ย) / (ส่วนเบี่ยงเบนมาตรฐาน)
แหล่งข้อมูลเพิ่มเติม
วิธีทำให้ข้อมูลเป็นมาตรฐานระหว่าง 0 ถึง 1
วิธีทำให้ข้อมูลเป็นมาตรฐานใน Excel
วิธีทำให้ข้อมูลเป็นมาตรฐานใน R
วิธีทำให้คอลัมน์เป็นมาตรฐานใน Python