วิธีการคำนวณความเบ้และความโด่งใน sas


ในสถิติ ความเบ้ และ ความโด่ง เป็นสองวิธีในการวัดรูปร่างของการแจกแจง

ความเบ้ วัดความไม่สมดุลของการกระจาย

  • ความเบ้เชิงลบบ่งชี้ว่าหางอยู่ทางด้านซ้ายของการกระจาย
  • การเอียงเชิงบวกบ่งชี้ว่าส่วนท้ายอยู่ทางด้านขวาของการกระจายตัว
  • ค่าศูนย์บ่งชี้ว่าไม่มีความไม่สมดุลในการแจกแจง ซึ่งหมายความว่าการแจกแจงมีความสมมาตรอย่างสมบูรณ์

Kurtosis เป็นการวัดว่าการกระจายแบบหนักหรือแบบหางเบาเมื่อเทียบกับ การกระจายแบบปกติ

  • ความโด่งของการแจกแจงแบบปกติคือ 0
  • หากการแจกแจงแบบใดแบบหนึ่งมีความโด่งน้อยกว่า 0 จะเรียกว่า เพลย์เคิร์ก ซึ่งหมายความว่ามีแนวโน้มที่จะสร้างค่าผิดปกติที่รุนแรงน้อยลงและน้อยลงกว่าการแจกแจงแบบปกติ
  • หากการแจกแจงแบบใดแบบหนึ่งมีความโด่งมากกว่า 0 จะเรียกว่าเป็น เลปโตเคอร์ติก ซึ่งหมายความว่ามีแนวโน้มที่จะสร้างค่าผิดปกติมากกว่าการแจกแจงแบบปกติ

ในการคำนวณความเบ้และความโด่งของตัวแปรใน SAS คุณสามารถใช้คำสั่ง SKEWNESS และ KURTOSIS ใน PROC MEANS

ตัวอย่างต่อไปนี้แสดงวิธีใช้คำแนะนำเหล่านี้ในทางปฏิบัติ

ตัวอย่าง: การคำนวณความเบ้และความโด่งใน SAS

สมมติว่าเรามีชุดข้อมูลต่อไปนี้ใน SAS ที่มีข้อมูลเกี่ยวกับผู้เล่นบาสเกตบอลต่างๆ:

 /*create dataset*/
data my_data;
    input team $points assists;
    datalines ;
At 10 2
At 17 5
At 17 6
At 18 3
At 15 0
B 10 2
B 14 5
B 13 4
B 29 0
B 25 2
C 12 1
C 30 1
C 34 3
C 12 4
C 11 7
;
run ;

/*view dataset*/
proc print data =my_data; 

เราสามารถใช้ PROC MEANS กับคำสั่ง SKEWNESS และ KURTOSIS เพื่อคำนวณความเบ้และความโด่งของตัวแปรตัวเลขแต่ละตัวในชุดข้อมูล:

 /*calculate skewness and kurtosis for each numeric variable*/
proc means data =my_data SKEWNESS KURTOSIS ;
run ; 

ตารางเอาต์พุตจะแสดงค่าความเบ้และความโด่งสำหรับตัวแปรตัวเลขแต่ละตัวในชุดข้อมูล:

(1) คะแนน

  • ตัวแปรคะแนนมี ความเบ้ 1.009 เนื่องจากค่านี้มากกว่า 0 หมายความว่าส่วนท้ายอยู่ทางด้านขวาของการแจกแจง
  • ตัวแปรคะแนนมี ความโด่ง เป็น -0.299 เนื่องจากค่านี้น้อยกว่า 0 หมายความว่าการแจกแจงมีค่าผิดปกติน้อยกว่าเล็กน้อยและค่าสุดขั้วน้อยกว่าการแจกแจงแบบปกติ

(2) ช่วยเหลือ

  • ตัวแปรช่วยเหลือมี ความเบ้ 0.304 เนื่องจากค่านี้มากกว่า 0 หมายความว่าส่วนท้ายอยู่ทางด้านขวาของการแจกแจง
  • ตัวแปรสนับสนุนมี ความโด่ง เป็น -0.782 เนื่องจากค่านี้น้อยกว่า 0 หมายความว่าการแจกแจงมีค่าผิดปกติน้อยกว่าและค่าสุดขั้วน้อยกว่าการแจกแจงแบบปกติ

หากต้องการแสดงภาพการกระจายค่าสำหรับตัวแปรตัวเลขแต่ละตัวในชุดข้อมูล คุณสามารถใช้ PROC UNIVARIATE เพื่อสร้างฮิสโตแกรมสำหรับตัวแปรจุดและตัวแปรช่วยเหลือ:

 /*create histograms for points and assists variables*/
proc univariate data =my_data;
    var points assists;
    histogram points assists;
run ;

สิ่งนี้จะสร้างฮิสโตแกรมต่อไปนี้สำหรับตัวแปร จุด :

และฮิสโตแกรมต่อไปนี้สำหรับตัวแปร ช่วยเหลือ :

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้จะอธิบายวิธีดำเนินการงานทั่วไปอื่นๆ ใน SAS:

วิธีการคำนวณสถิติเชิงพรรณนาใน SAS
วิธีสร้างตารางความถี่ใน SAS
วิธีการคำนวณเปอร์เซ็นไทล์ใน SAS
วิธีสร้าง PivotTable ใน SAS

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *