วิธีการคำนวณ skewness & kurtosis ใน python
ในสถิติ ความเบ้ และ ความโด่ง เป็นสองวิธีในการวัดรูปร่างของการแจกแจง
ความเบ้ คือการวัดความเบ้ของการแจกแจง ค่านี้สามารถเป็นบวกหรือลบได้
- ความเบ้เชิงลบบ่งชี้ว่าส่วนท้ายอยู่ทางด้านซ้ายของการแจกแจง ซึ่งขยายไปสู่ค่าลบมากขึ้น
- การเอียงเชิงบวกบ่งชี้ว่าส่วนท้ายอยู่ทางด้านขวาของการแจกแจง ซึ่งขยายไปสู่ค่าบวกมากขึ้น
- ค่าศูนย์บ่งชี้ว่าไม่มีความไม่สมดุลในการแจกแจง ซึ่งหมายความว่าการแจกแจงมีความสมมาตรอย่างสมบูรณ์
Kurtosis เป็นตัววัดว่าการกระจายแบบหนักหรือแบบหางเบาเมื่อเทียบกับ การกระจายแบบปกติ
- ความโด่งของการแจกแจงแบบปกติคือ 3
- หากการแจกแจงแบบใดแบบหนึ่งมีความโด่งน้อยกว่า 3 จะเรียกว่า เพลย์เคิร์ก ซึ่งหมายความว่ามีแนวโน้มที่จะสร้างค่าผิดปกติที่รุนแรงน้อยลงและน้อยลงกว่าการแจกแจงแบบปกติ
- หากการกระจายแบบใดแบบหนึ่งมีความโด่งมากกว่า 3 ก็เรียกว่าเป็น โรคเลปโตเคอร์ติก ซึ่งหมายความว่ามีแนวโน้มที่จะสร้างค่าผิดปกติมากกว่าการกระจายแบบปกติ
หมายเหตุ: บางสูตร (คำจำกัดความของฟิชเชอร์) ลบ 3 ออกจากความโด่งเพื่อให้ง่ายต่อการเปรียบเทียบกับการแจกแจงแบบปกติ เมื่อใช้คำจำกัดความนี้ การแจกแจงจะมีความโด่งมากกว่าการแจกแจงแบบปกติ หากมีค่าความโด่งมากกว่า 0
บทช่วยสอนนี้จะอธิบายวิธีคำนวณทั้งความเบ้และความโด่งของชุดข้อมูลที่กำหนดใน Python
ตัวอย่าง: ความเบ้และแบนใน Python
สมมติว่าเรามีชุดข้อมูลต่อไปนี้:
data = [88, 85, 82, 97, 67, 77, 74, 86, 81, 95, 77, 88, 85, 76, 81]
ในการคำนวณความเบ้และความโด่งของตัวอย่างของชุดข้อมูลนี้ เราสามารถใช้ฟังก์ชัน skew() และ kurt() จากไลบรารี Scipy Stata โดยมีไวยากรณ์ต่อไปนี้:
- อคติ (อาร์เรย์ของค่า อคติ = เท็จ)
- เคิร์ต (อาร์เรย์ของค่า อคติ = เท็จ)
เราใช้อาร์กิวเมนต์ bias=False เพื่อคำนวณความเบ้และความโด่งของตัวอย่าง ซึ่งตรงข้ามกับความเบ้ของประชากรและความโด่ง
ต่อไปนี้คือวิธีใช้ฟังก์ชันเหล่านี้กับชุดข้อมูลเฉพาะของเรา:
data = [88, 85, 82, 97, 67, 77, 74, 86, 81, 95, 77, 88, 85, 76, 81] #calculate sample skewness skew(data, bias= False ) 0.032697 #calculate sample kurtosis kurtosis(data, bias= False ) 0.118157
ความเบ้กลายเป็น 0.032697 และความโด่งกลายเป็น 0.118157 .
ซึ่งหมายความว่าการแจกแจงมีความเบ้ในเชิงบวกเล็กน้อยและมีค่าในส่วนท้ายมากกว่าเมื่อเทียบกับการแจกแจงแบบปกติ
แหล่งข้อมูลเพิ่มเติม: เครื่องคำนวณความเบ้และเคอร์โทซิส
คุณยังสามารถคำนวณความเบ้สำหรับชุดข้อมูลที่กำหนดได้โดยใช้ เครื่องคำนวณความเบ้และเคอร์โทซิสทางสถิติ ซึ่งจะคำนวณความเบ้และความโด่งสำหรับชุดข้อมูลที่กำหนดโดยอัตโนมัติ