วิธีแปลงข้อมูลใน excel (บันทึก, สแควร์รูท, รูทคิวบ์)
การทดสอบทางสถิติจำนวนมากถือว่าชุดข้อมูลมี การกระจายตามปกติ
อย่างไรก็ตาม สมมติฐานนี้มักถูกละเมิดในทางปฏิบัติ วิธีหนึ่งในการแก้ปัญหานี้คือการแปลงค่าในชุดข้อมูลโดยใช้การแปลงแบบใดแบบหนึ่งจากสามแบบต่อไปนี้:
1. Log Transform: แปลงค่า y เป็น log(y)
2. การแปลงรากที่สอง: แปลงค่า y เป็น √y .
3. การแปลงรูทคิวบ์: แปลงค่า y เป็น y 1/3 .
เมื่อทำการแปลงเหล่านี้ โดยทั่วไปข้อมูลจะประมาณค่าการแจกแจงแบบปกติ ตัวอย่างต่อไปนี้แสดงวิธีการดำเนินการแปลงเหล่านี้ใน Excel
การแปลงบันทึกใน Excel
หากต้องการใช้การแปลงบันทึกกับชุดข้อมูลใน Excel เราสามารถใช้ฟังก์ชัน =LOG10()
ภาพหน้าจอต่อไปนี้แสดงวิธีการใช้การแปลงบันทึกกับชุดข้อมูลใน Excel:
เพื่อตรวจสอบว่าการเปลี่ยนแปลงนี้ทำให้ชุดข้อมูลมีการกระจายแบบปกติมากขึ้นหรือไม่ เราสามารถทำการ ทดสอบภาวะปกติของ Jarque-Bera ใน Excel ได้
สถิติการทดสอบสำหรับการทดสอบนี้ถูกกำหนดเป็น:
เจบี =(n/6) * (ส 2 + (ค 2 /4))
ทอง:
- n: จำนวน การสังเกต ในกลุ่มตัวอย่าง
- S: ความไม่สมดุลของกลุ่มตัวอย่าง
- C: ตัวอย่างที่ประจบ
ภายใต้สมมติฐานว่างของภาวะปกติ JB ~ X 2 (2)
หาก ค่า p ที่สอดคล้องกับสถิติการทดสอบต่ำกว่าระดับนัยสำคัญที่กำหนด (เช่น α = 0.05) เราก็สามารถปฏิเสธสมมติฐานว่างและสรุปได้ว่าข้อมูลไม่มีการกระจายตามปกติ
ภาพหน้าจอต่อไปนี้แสดงวิธีดำเนินการทดสอบ Jarque-Bera สำหรับ ข้อมูลดิบ และข้อมูลที่แปลงแล้ว:
โปรดทราบว่าค่า p ของข้อมูลดิบน้อยกว่า 0.05 ซึ่งบ่งชี้ว่า ไม่มี การกระจายตามปกติ
อย่างไรก็ตาม ค่า p ของข้อมูลที่แปลงแล้วต้องไม่น้อยกว่า 0.05 ดังนั้นเราจึงสรุปได้ว่าข้อมูลดังกล่าว มี การกระจายตามปกติ สิ่งนี้บอกเราว่าการแปลงบันทึกใช้งานได้
การแปลงรากที่สองใน Excel
หากต้องการใช้การแปลงรากที่สองกับชุดข้อมูลใน Excel เราสามารถใช้ฟังก์ชัน =SQRT()
ภาพหน้าจอต่อไปนี้แสดงวิธีการนำการแปลงรากที่สองไปใช้กับชุดข้อมูลใน Excel:
โปรดทราบว่าค่า p ของการทดสอบภาวะปกติของ Jarque-Bera สำหรับข้อมูลที่แปลงแล้วไม่น้อยกว่า 0.05 ซึ่งบ่งชี้ว่าการแปลงรากที่สองมีประสิทธิผล
การแปลงรูทคิวบ์ใน Excel
หากต้องการใช้การแปลงรากที่สามกับชุดข้อมูลใน Excel เราสามารถใช้ฟังก์ชัน =DATA^(1/3)
ภาพหน้าจอต่อไปนี้แสดงวิธีการใช้การแปลงรากที่สามกับชุดข้อมูลใน Excel:
ค่า p ของการทดสอบภาวะปกติของ Jarque-Bera สำหรับข้อมูลที่แปลงแล้วไม่น้อยกว่า 0.05 ซึ่งบ่งชี้ว่าการแปลงรากที่สามมีประสิทธิผล
การแปลงข้อมูลทั้งสามอย่างมีประสิทธิภาพทำให้ข้อมูลดิบมีการกระจายตามปกติมากขึ้น
จากการแปลงทั้งสามครั้ง การแปลงลอการิทึมให้ค่า p-value สูงสุดในการทดสอบภาวะปกติของ Jarque-Bera โดยบอกเราว่ามีแนวโน้มทำให้ข้อมูลเป็นข้อมูลที่กระจายตามปกติ “มากที่สุด” ในการแปลงวิธีทั้งสามวิธี
แหล่งข้อมูลเพิ่มเติม
วิธีดำเนินการแปลง Box-Cox ใน Excel
ข้อสันนิษฐานปกติในสถิติคืออะไร?