วิธีสร้างตารางความถี่ใน sas (พร้อมตัวอย่าง)
คุณสามารถใช้ proc freq ใน SAS เพื่อสร้างตารางความถี่สำหรับตัวแปรตั้งแต่หนึ่งตัวขึ้นไปในชุดข้อมูลได้อย่างรวดเร็ว
ตัวอย่างต่อไปนี้แสดงวิธีใช้ขั้นตอนนี้กับชุดข้อมูลในตัวของ SAS ชื่อ BirthWgt ซึ่งมีลักษณะเฉพาะต่างๆ ของมารดา 100,000 รายที่เพิ่งคลอดบุตร
เราสามารถใช้ proc print เพื่อแสดงข้อสังเกต 10 รายการแรกของชุดข้อมูลนี้:
/*view first 10 observations from BirthWgt dataset*/ proc print data =sashelp.BirthWgt( obs = 10 ); run ;
ตัวอย่างที่ 1: ตารางความถี่ของตัวแปร
เราสามารถใช้โค้ดต่อไปนี้เพื่อสร้างตารางความถี่สำหรับตัวแปร Race:
/*create frequency table for Race variable*/
proc freq data =sashelp.BirthWgt;
Race tables ;
run ;
ตารางผลลัพธ์ประกอบด้วยสี่คอลัมน์:
- ความถี่ : จำนวนการสังเกตทั้งหมดที่อยู่ในหมวดหมู่ใดหมวดหมู่หนึ่ง
- เปอร์เซ็นต์ : เปอร์เซ็นต์ของการสังเกตทั้งหมดที่อยู่ในหมวดหมู่ใดหมวดหมู่หนึ่ง
- ความถี่สะสม : จำนวนการสังเกตทั้งหมดที่ได้รับการพิจารณาจนถึงและรวมแถวปัจจุบันด้วย
- เปอร์เซ็นต์สะสม : เปอร์เซ็นต์สะสมของการสังเกตทั้งหมดที่ได้รับการพิจารณาจนถึงและรวมถึงแถวปัจจุบัน
ตัวอย่างเช่น จากตารางผลลัพธ์ เราจะเห็น:
- จำนวนมารดาเชื้อสายสเปนทั้งหมด 22,139 คน
- เปอร์เซ็นต์รวมของมารดาชาวสเปนคือ 22.14%
- จำนวนมารดาชาวเอเชีย คนผิวดำ หรือฮิสแปนิกทั้งหมดอยู่ที่ 41,496 คน
- เปอร์เซ็นต์สะสมของมารดาชาวเอเชีย คนผิวดำ หรือฮิสแปนิกอยู่ที่ 41.50%
ตัวอย่างที่ 2: ตารางความถี่สำหรับตัวแปร (เรียงลำดับ)
ตามค่าเริ่มต้น ตารางความถี่จะเรียงลำดับตามตัวอักษรตามชื่อหมวดหมู่ อย่างไรก็ตาม เราสามารถใช้ฟังก์ชัน order เพื่อจัดเรียงหมวดหมู่ตามความถี่ได้:
/*create frequency table for Race variable, sorted by frequency*/
proc freq data =sashelp.BirthWgt order =freq;
Race tables ;
run ;
โปรดทราบว่าขณะนี้หมวดหมู่ต่างๆ จะถูกจัดเรียงตามความถี่ จากสูงสุดไปต่ำสุด
ตัวอย่างที่ 3: ตารางความถี่สำหรับตัวแปร (รวมค่าที่หายไป)
ตามค่าเริ่มต้น ค่าที่หายไปจะไม่รวมอยู่ในตารางความถี่
อย่างไรก็ตาม เราสามารถใช้คำสั่ง ที่หายไป เพื่อบอกให้ SAS รวมบรรทัดเพื่อนับความถี่ของค่าที่หายไป:
/*create frequency table for Race variable, sorted by frequency*/
proc freq data =sashelp.BirthWgt order =freq;
Race/missing tables ;
run ;
เนื่องจากไม่มีการเพิ่มแถวเพิ่มเติมลงในตารางความถี่ จึงบอกเราว่าไม่มีค่าที่ขาดหายไปสำหรับการแข่งขันในชุดข้อมูลดั้งเดิม
ตัวอย่างที่ 4: ตารางความถี่สำหรับตัวแปรหลายตัว
ในการสร้างตารางความถี่สำหรับตัวแปรหลายตัวในคราวเดียว เราสามารถรวมชื่อตัวแปรหลายชื่อไว้ในอาร์กิวเมนต์ ตาราง ได้
ตัวอย่างเช่น เราสามารถใช้โค้ดต่อไปนี้เพื่อสร้างตารางความถี่สำหรับ Race และ AgeGroup:
/*create frequency table for Race and AgeGroup variables, both sorted by frequency*/
proc freq data =sashelp.BirthWgt order =freq;
Race AgeGroup tables ;
run ;
เราจะเห็นได้ว่ามีการสร้างตารางความถี่สำหรับตัวแปรทั้งสองแล้ว