วิธีการคำนวณความเบ้และความโด่งใน sas
ในสถิติ ความเบ้ และ ความโด่ง เป็นสองวิธีในการวัดรูปร่างของการแจกแจง
ความเบ้ วัดความไม่สมดุลของการกระจาย
- ความเบ้เชิงลบบ่งชี้ว่าหางอยู่ทางด้านซ้ายของการกระจาย
- การเอียงเชิงบวกบ่งชี้ว่าส่วนท้ายอยู่ทางด้านขวาของการกระจายตัว
- ค่าศูนย์บ่งชี้ว่าไม่มีความไม่สมดุลในการแจกแจง ซึ่งหมายความว่าการแจกแจงมีความสมมาตรอย่างสมบูรณ์
Kurtosis เป็นการวัดว่าการกระจายแบบหนักหรือแบบหางเบาเมื่อเทียบกับ การกระจายแบบปกติ
- ความโด่งของการแจกแจงแบบปกติคือ 0
- หากการแจกแจงแบบใดแบบหนึ่งมีความโด่งน้อยกว่า 0 จะเรียกว่า เพลย์เคิร์ก ซึ่งหมายความว่ามีแนวโน้มที่จะสร้างค่าผิดปกติที่รุนแรงน้อยลงและน้อยลงกว่าการแจกแจงแบบปกติ
- หากการแจกแจงแบบใดแบบหนึ่งมีความโด่งมากกว่า 0 จะเรียกว่าเป็น เลปโตเคอร์ติก ซึ่งหมายความว่ามีแนวโน้มที่จะสร้างค่าผิดปกติมากกว่าการแจกแจงแบบปกติ
ในการคำนวณความเบ้และความโด่งของตัวแปรใน SAS คุณสามารถใช้คำสั่ง SKEWNESS และ KURTOSIS ใน PROC MEANS
ตัวอย่างต่อไปนี้แสดงวิธีใช้คำแนะนำเหล่านี้ในทางปฏิบัติ
ตัวอย่าง: การคำนวณความเบ้และความโด่งใน SAS
สมมติว่าเรามีชุดข้อมูลต่อไปนี้ใน SAS ที่มีข้อมูลเกี่ยวกับผู้เล่นบาสเกตบอลต่างๆ:
/*create dataset*/ data my_data; input team $points assists; datalines ; At 10 2 At 17 5 At 17 6 At 18 3 At 15 0 B 10 2 B 14 5 B 13 4 B 29 0 B 25 2 C 12 1 C 30 1 C 34 3 C 12 4 C 11 7 ; run ; /*view dataset*/ proc print data =my_data;
เราสามารถใช้ PROC MEANS กับคำสั่ง SKEWNESS และ KURTOSIS เพื่อคำนวณความเบ้และความโด่งของตัวแปรตัวเลขแต่ละตัวในชุดข้อมูล:
/*calculate skewness and kurtosis for each numeric variable*/ proc means data =my_data SKEWNESS KURTOSIS ; run ;
ตารางเอาต์พุตจะแสดงค่าความเบ้และความโด่งสำหรับตัวแปรตัวเลขแต่ละตัวในชุดข้อมูล:
(1) คะแนน
- ตัวแปรคะแนนมี ความเบ้ 1.009 เนื่องจากค่านี้มากกว่า 0 หมายความว่าส่วนท้ายอยู่ทางด้านขวาของการแจกแจง
- ตัวแปรคะแนนมี ความโด่ง เป็น -0.299 เนื่องจากค่านี้น้อยกว่า 0 หมายความว่าการแจกแจงมีค่าผิดปกติน้อยกว่าเล็กน้อยและค่าสุดขั้วน้อยกว่าการแจกแจงแบบปกติ
(2) ช่วยเหลือ
- ตัวแปรช่วยเหลือมี ความเบ้ 0.304 เนื่องจากค่านี้มากกว่า 0 หมายความว่าส่วนท้ายอยู่ทางด้านขวาของการแจกแจง
- ตัวแปรสนับสนุนมี ความโด่ง เป็น -0.782 เนื่องจากค่านี้น้อยกว่า 0 หมายความว่าการแจกแจงมีค่าผิดปกติน้อยกว่าและค่าสุดขั้วน้อยกว่าการแจกแจงแบบปกติ
หากต้องการแสดงภาพการกระจายค่าสำหรับตัวแปรตัวเลขแต่ละตัวในชุดข้อมูล คุณสามารถใช้ PROC UNIVARIATE เพื่อสร้างฮิสโตแกรมสำหรับตัวแปรจุดและตัวแปรช่วยเหลือ:
/*create histograms for points and assists variables*/
proc univariate data =my_data;
var points assists;
histogram points assists;
run ;
สิ่งนี้จะสร้างฮิสโตแกรมต่อไปนี้สำหรับตัวแปร จุด :
และฮิสโตแกรมต่อไปนี้สำหรับตัวแปร ช่วยเหลือ :
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้จะอธิบายวิธีดำเนินการงานทั่วไปอื่นๆ ใน SAS:
วิธีการคำนวณสถิติเชิงพรรณนาใน SAS
วิธีสร้างตารางความถี่ใน SAS
วิธีการคำนวณเปอร์เซ็นไทล์ใน SAS
วิธีสร้าง PivotTable ใน SAS