วิธีแปลงข้อมูลใน excel (บันทึก, สแควร์รูท, รูทคิวบ์)


การทดสอบทางสถิติจำนวนมากถือว่าชุดข้อมูลมี การกระจายตามปกติ

อย่างไรก็ตาม สมมติฐานนี้มักถูกละเมิดในทางปฏิบัติ วิธีหนึ่งในการแก้ปัญหานี้คือการแปลงค่าในชุดข้อมูลโดยใช้การแปลงแบบใดแบบหนึ่งจากสามแบบต่อไปนี้:

1. Log Transform: แปลงค่า y เป็น log(y)

2. การแปลงรากที่สอง: แปลงค่า y เป็น √y .

3. การแปลงรูทคิวบ์: แปลงค่า y เป็น y 1/3 .

เมื่อทำการแปลงเหล่านี้ โดยทั่วไปข้อมูลจะประมาณค่าการแจกแจงแบบปกติ ตัวอย่างต่อไปนี้แสดงวิธีการดำเนินการแปลงเหล่านี้ใน Excel

การแปลงบันทึกใน Excel

หากต้องการใช้การแปลงบันทึกกับชุดข้อมูลใน Excel เราสามารถใช้ฟังก์ชัน =LOG10()

ภาพหน้าจอต่อไปนี้แสดงวิธีการใช้การแปลงบันทึกกับชุดข้อมูลใน Excel:

เพื่อตรวจสอบว่าการเปลี่ยนแปลงนี้ทำให้ชุดข้อมูลมีการกระจายแบบปกติมากขึ้นหรือไม่ เราสามารถทำการ ทดสอบภาวะปกติของ Jarque-Bera ใน Excel ได้

สถิติการทดสอบสำหรับการทดสอบนี้ถูกกำหนดเป็น:

เจบี =(n/6) * (ส 2 + (ค 2 /4))

ทอง:

  • n: จำนวน การสังเกต ในกลุ่มตัวอย่าง
  • S: ความไม่สมดุลของกลุ่มตัวอย่าง
  • C: ตัวอย่างที่ประจบ

ภายใต้สมมติฐานว่างของภาวะปกติ JB ~ X 2 (2)

หาก ค่า p ที่สอดคล้องกับสถิติการทดสอบต่ำกว่าระดับนัยสำคัญที่กำหนด (เช่น α = 0.05) เราก็สามารถปฏิเสธสมมติฐานว่างและสรุปได้ว่าข้อมูลไม่มีการกระจายตามปกติ

ภาพหน้าจอต่อไปนี้แสดงวิธีดำเนินการทดสอบ Jarque-Bera สำหรับ ข้อมูลดิบ และข้อมูลที่แปลงแล้ว:

บันทึกข้อมูลที่แปลงแล้วใน Excel

โปรดทราบว่าค่า p ของข้อมูลดิบน้อยกว่า 0.05 ซึ่งบ่งชี้ว่า ไม่มี การกระจายตามปกติ

อย่างไรก็ตาม ค่า p ของข้อมูลที่แปลงแล้วต้องไม่น้อยกว่า 0.05 ดังนั้นเราจึงสรุปได้ว่าข้อมูลดังกล่าว มี การกระจายตามปกติ สิ่งนี้บอกเราว่าการแปลงบันทึกใช้งานได้

การแปลงรากที่สองใน Excel

หากต้องการใช้การแปลงรากที่สองกับชุดข้อมูลใน Excel เราสามารถใช้ฟังก์ชัน =SQRT()

ภาพหน้าจอต่อไปนี้แสดงวิธีการนำการแปลงรากที่สองไปใช้กับชุดข้อมูลใน Excel:

การแปลงรากที่สองใน Excel

โปรดทราบว่าค่า p ของการทดสอบภาวะปกติของ Jarque-Bera สำหรับข้อมูลที่แปลงแล้วไม่น้อยกว่า 0.05 ซึ่งบ่งชี้ว่าการแปลงรากที่สองมีประสิทธิผล

การแปลงรูทคิวบ์ใน Excel

หากต้องการใช้การแปลงรากที่สามกับชุดข้อมูลใน Excel เราสามารถใช้ฟังก์ชัน =DATA^(1/3)

ภาพหน้าจอต่อไปนี้แสดงวิธีการใช้การแปลงรากที่สามกับชุดข้อมูลใน Excel:

การแปลงรูทคิวบ์ใน Excel

ค่า p ของการทดสอบภาวะปกติของ Jarque-Bera สำหรับข้อมูลที่แปลงแล้วไม่น้อยกว่า 0.05 ซึ่งบ่งชี้ว่าการแปลงรากที่สามมีประสิทธิผล

การแปลงข้อมูลทั้งสามอย่างมีประสิทธิภาพทำให้ข้อมูลดิบมีการกระจายตามปกติมากขึ้น

จากการแปลงทั้งสามครั้ง การแปลงลอการิทึมให้ค่า p-value สูงสุดในการทดสอบภาวะปกติของ Jarque-Bera โดยบอกเราว่ามีแนวโน้มทำให้ข้อมูลเป็นข้อมูลที่กระจายตามปกติ “มากที่สุด” ในการแปลงวิธีทั้งสามวิธี

แหล่งข้อมูลเพิ่มเติม

วิธีดำเนินการแปลง Box-Cox ใน Excel
ข้อสันนิษฐานปกติในสถิติคืออะไร?

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *