วิธีสร้างตารางความถี่ใน sas (พร้อมตัวอย่าง)


คุณสามารถใช้ proc freq ใน SAS เพื่อสร้างตารางความถี่สำหรับตัวแปรตั้งแต่หนึ่งตัวขึ้นไปในชุดข้อมูลได้อย่างรวดเร็ว

ตัวอย่างต่อไปนี้แสดงวิธีใช้ขั้นตอนนี้กับชุดข้อมูลในตัวของ SAS ชื่อ BirthWgt ซึ่งมีลักษณะเฉพาะต่างๆ ของมารดา 100,000 รายที่เพิ่งคลอดบุตร

เราสามารถใช้ proc print เพื่อแสดงข้อสังเกต 10 รายการแรกของชุดข้อมูลนี้:

 /*view first 10 observations from BirthWgt dataset*/
proc print data =sashelp.BirthWgt( obs = 10 );

run ;

ตัวอย่างที่ 1: ตารางความถี่ของตัวแปร

เราสามารถใช้โค้ดต่อไปนี้เพื่อสร้างตารางความถี่สำหรับตัวแปร Race:

 /*create frequency table for Race variable*/
proc freq data =sashelp.BirthWgt;
	Race tables ;
run ; 

ตารางความถี่ใน SAS

ตารางผลลัพธ์ประกอบด้วยสี่คอลัมน์:

  • ความถี่ : จำนวนการสังเกตทั้งหมดที่อยู่ในหมวดหมู่ใดหมวดหมู่หนึ่ง
  • เปอร์เซ็นต์ : เปอร์เซ็นต์ของการสังเกตทั้งหมดที่อยู่ในหมวดหมู่ใดหมวดหมู่หนึ่ง
  • ความถี่สะสม : จำนวนการสังเกตทั้งหมดที่ได้รับการพิจารณาจนถึงและรวมแถวปัจจุบันด้วย
  • เปอร์เซ็นต์สะสม : เปอร์เซ็นต์สะสมของการสังเกตทั้งหมดที่ได้รับการพิจารณาจนถึงและรวมถึงแถวปัจจุบัน

ตัวอย่างเช่น จากตารางผลลัพธ์ เราจะเห็น:

  • จำนวนมารดาเชื้อสายสเปนทั้งหมด 22,139 คน
  • เปอร์เซ็นต์รวมของมารดาชาวสเปนคือ 22.14%
  • จำนวนมารดาชาวเอเชีย คนผิวดำ หรือฮิสแปนิกทั้งหมดอยู่ที่ 41,496 คน
  • เปอร์เซ็นต์สะสมของมารดาชาวเอเชีย คนผิวดำ หรือฮิสแปนิกอยู่ที่ 41.50%

ตัวอย่างที่ 2: ตารางความถี่สำหรับตัวแปร (เรียงลำดับ)

ตามค่าเริ่มต้น ตารางความถี่จะเรียงลำดับตามตัวอักษรตามชื่อหมวดหมู่ อย่างไรก็ตาม เราสามารถใช้ฟังก์ชัน order เพื่อจัดเรียงหมวดหมู่ตามความถี่ได้:

 /*create frequency table for Race variable, sorted by frequency*/
proc freq data =sashelp.BirthWgt order =freq;
	Race tables ;
run ; 

โปรดทราบว่าขณะนี้หมวดหมู่ต่างๆ จะถูกจัดเรียงตามความถี่ จากสูงสุดไปต่ำสุด

ตัวอย่างที่ 3: ตารางความถี่สำหรับตัวแปร (รวมค่าที่หายไป)

ตามค่าเริ่มต้น ค่าที่หายไปจะไม่รวมอยู่ในตารางความถี่

อย่างไรก็ตาม เราสามารถใช้คำสั่ง ที่หายไป เพื่อบอกให้ SAS รวมบรรทัดเพื่อนับความถี่ของค่าที่หายไป:

 /*create frequency table for Race variable, sorted by frequency*/
proc freq data =sashelp.BirthWgt order =freq;
	Race/missing tables ;
run ; 

เนื่องจากไม่มีการเพิ่มแถวเพิ่มเติมลงในตารางความถี่ จึงบอกเราว่าไม่มีค่าที่ขาดหายไปสำหรับการแข่งขันในชุดข้อมูลดั้งเดิม

ตัวอย่างที่ 4: ตารางความถี่สำหรับตัวแปรหลายตัว

ในการสร้างตารางความถี่สำหรับตัวแปรหลายตัวในคราวเดียว เราสามารถรวมชื่อตัวแปรหลายชื่อไว้ในอาร์กิวเมนต์ ตาราง ได้

ตัวอย่างเช่น เราสามารถใช้โค้ดต่อไปนี้เพื่อสร้างตารางความถี่สำหรับ Race และ AgeGroup:

 /*create frequency table for Race and AgeGroup variables, both sorted by frequency*/
proc freq data =sashelp.BirthWgt order =freq;
	Race AgeGroup tables ;
run ; 

เราจะเห็นได้ว่ามีการสร้างตารางความถี่สำหรับตัวแปรทั้งสองแล้ว

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *