Sas: วิธีระบุจำนวนถังขยะในฮิสโตแกรม
คุณสามารถใช้คำสั่ง จุดกึ่งกลาง เพื่อระบุจำนวนกลุ่มที่จะใช้ในฮิสโตแกรมใน SAS
คำสั่งนี้ใช้ไวยากรณ์พื้นฐานต่อไปนี้:
proc univariate data =my_data; histogram my_variable / midpoints =( 9 to 36 by 3 ); run ;
ตัวอย่างนี้สร้างฮิสโตแกรมที่มีจุดกึ่งกลางตั้งแต่ 9 ถึง 36 ในช่วงเวลา 3
ตัวอย่างต่อไปนี้แสดงวิธีใช้ไวยากรณ์นี้ในทางปฏิบัติ
ตัวอย่าง: วิธีระบุจำนวนถังขยะในฮิสโตแกรมใน SAS
สมมติว่าเรามีชุดข้อมูลต่อไปนี้ใน SAS ที่มีข้อมูลเกี่ยวกับผู้เล่นบาสเกตบอลต่างๆ:
/*create dataset*/ data my_data; input team $pointsrebounds; datalines ; At 29 8 At 23 6 At 20 6 At 21 9 At 33 14 At 35 11 At 31 10 B 21 9 B 14 5 B 15 7 B 11 10 B 12 6 B 10 8 B 15 10 ; run ; /*view dataset*/ proc print data =my_data;
เราสามารถใช้ไวยากรณ์ต่อไปนี้เพื่อสร้างฮิสโตแกรมสำหรับตัวแปร จุด :
/*create histogram for variable points*/
proc univariate data =my_data;
histogram points;
run ;
แกน X จะแสดงค่าของตัวแปร จุด และแกน Y จะแสดงเปอร์เซ็นต์ของการสังเกตในชุดข้อมูลที่ตรงกับค่าที่ต่างกัน
โปรดทราบว่าจุดกึ่งกลางของฮิสโตแกรมเกิดขึ้นที่ช่วง 6
ในการเพิ่มจำนวนกล่องในฮิสโตแกรม เราสามารถระบุได้ว่าจุดกึ่งกลางเกิดขึ้นในช่วงเวลา 3 :
/*create histogram for points variable with custom bins*/
proc univariate data =my_data;
histogram points / midpoints =( 9 to 36 by 3 );
run ;
โปรดทราบว่าฮิสโตแกรมนี้มีกลุ่มทั้งหมดมากกว่าฮิสโตแกรมก่อนหน้า เนื่องจากเราลดช่วงเวลาระหว่างจุดกึ่งกลางลง
เพื่อลดจำนวนกล่องในฮิสโตแกรม เราสามารถระบุได้ว่าจุดกึ่งกลางเกิดขึ้นในช่วงเวลา 9 :
/*create histogram for points variable with custom bins*/
proc univariate data =my_data;
histogram points / midpoints =( 9 to 36 by 9 );
run ;
โปรดทราบว่าฮิสโตแกรมนี้มีกลุ่มทั้งหมดน้อยกว่าฮิสโตแกรมก่อนหน้า เนื่องจากเราขยายช่วงเวลาระหว่างจุดกึ่งกลาง
อย่าลังเลที่จะเล่นกับค่าในคำสั่ง จุดกึ่งกลาง เพื่อเพิ่มหรือลดจำนวนกล่องในฮิสโตแกรมของคุณ
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้จะอธิบายวิธีสร้างแผนภูมิอื่นๆ ใน SAS:
วิธีสร้างพล็อตเส้นใน SAS
วิธีสร้าง boxplots ตามกลุ่มใน SAS
วิธีสร้าง Scatterplot ด้วยเส้นการถดถอยใน SAS