วิธีใช้สรุปขั้นตอนใน sas (พร้อมตัวอย่าง)


คุณสามารถใช้ Procedure Summary ใน SAS เพื่อคำนวณ สถิติเชิงพรรณนา ต่อไปนี้สำหรับตัวแปรตั้งแต่หนึ่งตัวขึ้นไปในชุดข้อมูลอย่างรวดเร็ว:

  • N : จำนวนการสังเกตทั้งหมด
  • MIN : ค่าต่ำสุด
  • MAX : ค่าสูงสุด
  • ค่าเฉลี่ย : ค่าเฉลี่ย
  • STD : ส่วนเบี่ยงเบนมาตรฐาน

ตัวอย่างต่อไปนี้แสดงวิธีใช้ขั้นตอนนี้กับชุดข้อมูลในตัวของ SAS ที่เรียกว่า Fish ซึ่งมีการวัดต่างๆ สำหรับปลาที่แตกต่างกัน 159 ตัวที่จับได้ในทะเลสาบในฟินแลนด์

เราสามารถใช้ proc print เพื่อแสดง ข้อสังเกต 10 รายการแรกของชุดข้อมูลนี้:

 /*view first 10 observations from Fish dataset*/
proc print data =sashelp.Fish( obs = 10 );

run ;

ที่เกี่ยวข้อง: วิธีระบุค่าผิดปกติใน SAS

ตัวอย่างที่ 1: สรุปขั้นตอนด้วยตัวแปร

เราสามารถใช้โค้ดต่อไปนี้เพื่อคำนวณสถิติเชิงพรรณนาสำหรับตัวแปร Weight:

 /*calculate descriptive statistics for Weight variable*/
proc summary data =sashelp.Fish;
   var Weight ;
   output out =summaryWeight;
run ;

/*print output dataset*/
proc print data =summaryWeight; 

ต่อไปนี้เป็นวิธีการตีความตารางผลลัพธ์:

  • _TYPE_: คอลัมน์นี้ระบุว่าแต่ละแถวในชุดข้อมูลถูกใช้เพื่อคำนวณสถิติเชิงพรรณนาหรือไม่ 0 = มีการใช้ทุกบรรทัดแล้ว
  • _FREQ_: จำนวนแถวที่ใช้ในการคำนวณสถิติเชิงพรรณนาแต่ละรายการ
  • _STAT_: ชื่อของสถิติเชิงพรรณนา
  • น้ำหนัก: ค่าตัวเลขของสถิติเชิงพรรณนาที่สอดคล้องกัน

จากผลลัพธ์เราจะเห็นได้ว่า:

  • จำนวนการสังเกตทั้งหมดคือ 158
  • ค่าน้ำหนักขั้นต่ำคือ 0
  • น้ำหนักสูงสุดอยู่ที่ 1,650
  • มีค่าน้ำหนักเฉลี่ย 398.70
  • ค่าเบี่ยงเบนมาตรฐานของค่าน้ำหนักคือ 359.09 .

จากค่าทั้งห้านี้ เราจะมีความเข้าใจที่ดีพอสมควรเกี่ยวกับการแจกแจงค่าของตัวแปร Weight

ตัวอย่างที่ 2: สรุปกระบวนการที่มีหลายตัวแปร

หากต้องการคำนวณสถิติเชิงพรรณนาสำหรับตัวแปรหลายตัวในคราวเดียว เพียงแสดงรายการชื่อตัวแปรหลายรายการในคำสั่ง var

ตัวอย่างเช่น เราสามารถใช้โค้ดต่อไปนี้เพื่อคำนวณสถิติเชิงพรรณนาสำหรับตัวแปร Weight และ Height:

 /*calculate descriptive statistics for Weight and Height variables*/
proc summary data =sashelp.Fish;
   var Weight Height ;
   output out =summaryWeightHeight;
run ;

/*print output dataset*/
proc print data =summaryWeightHeight; 

จากผลลัพธ์ เราจะเห็นสถิติเชิงพรรณนาทั้ง 5 ประการเกี่ยวกับน้ำหนักและส่วนสูง

ตัวอย่างที่ 3: สรุปกระบวนการที่มีตัวแปรหนึ่งจัดกลุ่มตามตัวแปรอื่น

ในการคำนวณสถิติเชิงพรรณนาสำหรับตัวแปรที่จัดกลุ่มตามตัวแปรอื่น เราสามารถใช้คำสั่ง class ได้

ตัวอย่างเช่น เราสามารถใช้โค้ดต่อไปนี้เพื่อคำนวณสถิติเชิงพรรณนาสำหรับน้ำหนักที่จัดกลุ่มตามสายพันธุ์:

 /*calculate descriptive statistics for Weight grouped by Species*/
proc summary data =sashelp.Fish;
   var Weight ;
   class Species;
   output out =summaryWeightSpecies;
run ;

/*print output dataset*/
proc print data =summaryWeightSpecies; 

ตารางผลลัพธ์จะแสดงสถิติเชิงพรรณนาสำหรับปลาแต่ละสายพันธุ์

ตัวอย่างเช่น เราสามารถสังเกตสถิติเชิงพรรณนาต่อไปนี้สำหรับปลาทรายแดงเพียงอย่างเดียว:

  • จำนวนการสังเกตทั้งหมดคือ 34
  • ค่าน้ำหนักขั้นต่ำคือ 242
  • ค่าน้ำหนักสูงสุดคือ 1,000
  • น้ำหนักเฉลี่ยอยู่ที่ 626
  • ค่าเบี่ยงเบนมาตรฐานของค่าน้ำหนักคือ 206.60

นอกจากนี้เรายังสามารถสังเกตสถิติเชิงพรรณนาเหล่านี้สำหรับสายพันธุ์อื่น ๆ ทั้งหมด

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้จะอธิบายวิธีดำเนินการงานทั่วไปอื่นๆ ใน SAS:

วิธีใช้ Proc ผนวกใน SAS
วิธีใช้ Proc Tabulate ใน SAS
วิธีการคำนวณความสัมพันธ์ใน SAS
วิธีสร้างตารางความถี่ใน SAS

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *