การทำให้เป็นมาตรฐานหรือการทำให้เป็นมาตรฐาน: อะไรคือความแตกต่าง?


การทำให้เป็นมาตรฐาน และ การทำให้เป็นมาตรฐาน เป็นสองวิธีในการปรับขนาดข้อมูล

การทำให้เป็นมาตรฐาน จะปรับขนาดชุดข้อมูลให้มีค่าเฉลี่ย 0 และค่าเบี่ยงเบนมาตรฐานเป็น 1 เมื่อต้องการทำเช่นนี้ จะใช้สูตรต่อไปนี้:

x ใหม่ = (x ix ) / s

ทอง:

  • x i : ค่า ที่ i ของชุดข้อมูล
  • x : หมายถึงตัวอย่าง
  • s : ค่าเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่าง

การทำให้เป็นมาตรฐาน จะปรับขนาดชุดข้อมูลเพื่อให้แต่ละค่าอยู่ระหว่าง 0 ถึง 1 ซึ่งทำได้โดยใช้สูตรต่อไปนี้:

x ใหม่ = (x i – x นาที ) / (x สูงสุด – x นาที )

ทอง:

  • x i : ค่า ที่ i ของชุดข้อมูล
  • x min : ค่าต่ำสุดในชุดข้อมูล
  • x max : ค่าสูงสุดในชุดข้อมูล

ตัวอย่างต่อไปนี้แสดงวิธีการสร้างมาตรฐานและทำให้ชุดข้อมูลเป็นมาตรฐานในทางปฏิบัติ

ตัวอย่าง: วิธีสร้างมาตรฐานข้อมูล

สมมติว่าเรามีชุดข้อมูลต่อไปนี้:

ค่าเฉลี่ยในชุดข้อมูลคือ 43.15 และส่วนเบี่ยงเบนมาตรฐานคือ 22.13

เพื่อทำให้ค่าแรกของ 13 เป็นมาตรฐาน เราจะใช้สูตรที่แชร์ก่อนหน้านี้:

  • x ใหม่ = (x ผมx ) / s = (13 – 43.15) / 22.13 = -1.36

หากต้องการทำให้ค่าที่สองเป็น 16 ให้เป็นปกติ เราจะใช้สูตรเดียวกัน:

  • x ใหม่ = (x ผมx ) / s = (16 – 43.15) / 22.13 = -1.23

หากต้องการทำให้ค่าที่สามของ 19 เป็นมาตรฐาน เราจะใช้สูตรเดียวกัน:

  • x ใหม่ = (x ผมx ) / s = (19 – 43.15) / 22.13 = -1.09

เราสามารถใช้สูตรเดียวกันนี้เพื่อสร้างมาตรฐานให้กับแต่ละค่าในชุดข้อมูลดั้งเดิม:

ตัวอย่าง: วิธีทำให้ข้อมูลเป็นมาตรฐาน

อีกครั้ง สมมติว่าเรามีชุดข้อมูลต่อไปนี้:

ค่าต่ำสุดในชุดข้อมูลคือ 13 และค่าสูงสุดคือ 71

เพื่อทำให้ค่าแรกของ 13 เป็นมาตรฐาน เราจะใช้สูตรที่แชร์ก่อนหน้านี้:

  • x ใหม่ = (x i – x นาที ) / (x สูงสุด – x นาที ) = (13 – 13) / (71 – 13) = 0

หากต้องการทำให้ค่าที่สองเป็น 16 ให้เป็นปกติ เราจะใช้สูตรเดียวกัน:

  • x ใหม่ = (x i – x นาที ) / (x สูงสุด – x นาที ) = (16 – 13) / (71 – 13) = 0.0517

หากต้องการทำให้ค่าที่สามของ 19 เป็นมาตรฐาน เราจะใช้สูตรเดียวกัน:

  • x ใหม่ = (x i – x นาที ) / (x สูงสุด – x นาที ) = (19 – 13) / (71 – 13) = 0.1034

เราสามารถใช้สูตรเดียวกันนี้เพื่อทำให้แต่ละค่าในชุดข้อมูลดั้งเดิมเป็นมาตรฐานระหว่าง 0 ถึง 1:

ทำให้ข้อมูลเป็นมาตรฐานระหว่าง 0 ถึง 1

การทำให้เป็นมาตรฐานหรือการทำให้เป็นมาตรฐาน: ควรใช้เมื่อใด?

โดยทั่วไป เราจะทำให้ข้อมูล เป็นมาตรฐาน เมื่อเราทำการวิเคราะห์บางประเภทโดยที่เรามีตัวแปรหลายตัวที่วัดในระดับที่แตกต่างกัน และเราต้องการให้ตัวแปรแต่ละตัวมีช่วงเดียวกัน

วิธีนี้จะป้องกันไม่ให้ตัวแปรตัวหนึ่งมีอิทธิพลเกินควร โดยเฉพาะอย่างยิ่งหากมีการวัดในหน่วยที่แตกต่างกัน (เช่น หากตัวแปรตัวหนึ่งวัดเป็นนิ้วและอีกตัววัดเป็นหลา)

ในทางกลับกัน โดยทั่วไปเรา จะทำให้ข้อมูลเป็นมาตรฐาน เมื่อเราต้องการทราบว่าแต่ละค่าในชุดข้อมูลมาจากค่าเฉลี่ยเป็นจำนวนเท่าใด

เช่น เราอาจมีรายการคะแนนสอบของนักเรียน 500 คนในโรงเรียนแห่งหนึ่ง และเราอยากทราบว่าคะแนนสอบแต่ละคะแนนมาจากคะแนนเฉลี่ยเป็นจำนวนเท่าใด

ในกรณีนี้ เราสามารถทำให้ข้อมูลดิบเป็นมาตรฐานเพื่อให้ทราบข้อมูลนี้ได้ จากนั้นคะแนนมาตรฐาน 1.26 จะบอกเราว่าคะแนนสอบของนักเรียนคนนี้คือ 1.26 ส่วนเบี่ยงเบนมาตรฐาน ซึ่งสูงกว่าคะแนนสอบเฉลี่ย

ไม่ว่าคุณจะตัดสินใจทำให้ข้อมูลของคุณเป็นมาตรฐานหรือเป็นมาตรฐาน โปรดคำนึงถึงประเด็นต่อไปนี้:

  • ชุดข้อมูลที่ทำให้เป็นมาตรฐาน จะมีค่าระหว่าง 0 ถึง 1 เสมอ
  • ชุดข้อมูลมาตรฐาน จะมีค่าเฉลี่ยเป็น 0 และส่วนเบี่ยงเบนมาตรฐานเป็น 1 แต่ไม่มีขีดจำกัดบนหรือล่างเฉพาะสำหรับค่าสูงสุดและต่ำสุด

ขึ้นอยู่กับสถานการณ์เฉพาะของคุณ การทำให้ข้อมูลเป็นมาตรฐานหรือเป็นมาตรฐานอาจเหมาะสมกว่า

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้จะอธิบายวิธีสร้างมาตรฐานและทำให้ข้อมูลเป็นมาตรฐานในซอฟต์แวร์ทางสถิติต่างๆ:

วิธีทำให้ข้อมูลเป็นมาตรฐานใน R
วิธีทำให้ข้อมูลเป็นมาตรฐานใน Excel
วิธีทำให้ข้อมูลเป็นมาตรฐานใน Python
วิธีสร้างมาตรฐานข้อมูลใน R

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *