วิธีใช้ proc surveyselect ใน sas (พร้อมตัวอย่าง)


คุณสามารถใช้ PROC SURVEYSELECT เพื่อเลือกตัวอย่างแบบสุ่มจากชุดข้อมูลใน SAS

ต่อไปนี้เป็นวิธีทั่วไปสามวิธีในการใช้ขั้นตอนนี้ในทางปฏิบัติ:

ตัวอย่างที่ 1: ใช้ PROC SURVEYSELECT เพื่อเลือกตัวอย่างสุ่มอย่างง่าย

 proc surveyselect data =my_data
out =my_sample
    method =srs /*use simple random sampling*/
    n =5 /*select a total of 5 observations*/
    seed =1; /*set seed to make this example reproducible*/
run ;

ตัวอย่างนี้เลือกการสังเกตแบบสุ่ม 5 รายการจากชุดข้อมูล

ตัวอย่างที่ 2: ใช้ PROC SURVEYSELECT เพื่อเลือกตัวอย่างแบบสุ่มแบบแบ่งชั้น

 proc surveyselect data =my_data
out =my_sample
    method =srs /*use simple random sampling*/
    n =2 /*select 2 observations from each strata*/
    seed =1; /*set seed to make this example reproducible*/
strata grouping_var; /*specify variable to use for stratification*/
run ;

ตัวอย่างนี้จะเลือกการสังเกตแบบสุ่ม 2 รายการจากแต่ละชั้นข้อมูลที่ไม่ซ้ำกันของชุดข้อมูล

คำสั่ง strata ระบุตัวแปรที่จะใช้สำหรับการแบ่งชั้น

ตัวอย่างที่ 3: ใช้ PROC SURVEYSELECT เพื่อเลือกตัวอย่างแบบสุ่มรวมกลุ่ม

 proc surveyselect data =my_data
out =my_sample
    n =2 /*select 2 clusters*/
    seed =1; /*set seed to make this example reproducible*/
clustergrouping_var ; /*specify variable to use for stratification*/
run ;

ตัวอย่างเฉพาะนี้จะเลือกกลุ่มสุ่ม 2 กลุ่มจากชุดข้อมูล และรวมทุกการสังเกตจากทุกกลุ่มในกลุ่มตัวอย่าง

คำสั่ง คลัสเตอร์ ระบุตัวแปรที่จะใช้สำหรับการทำคลัสเตอร์

ตัวอย่างต่อไปนี้แสดงวิธีการใช้แต่ละวิธีในทางปฏิบัติกับชุดข้อมูลต่อไปนี้ใน SAS ซึ่งมีข้อมูลเกี่ยวกับผู้เล่นบาสเกตบอลจากทีมต่างๆ:

 /*create dataset*/
data my_data;
    input team $points;
    datalines ;
AT 12
At 14
At 22
At 35
At 40
B 12
B 10
B29
B 33
C40
C25
C 11
C 10
C15
;
run ;

/*view dataset*/
proc print data = my_data; 

ตัวอย่างที่ 1: ใช้ PROC SURVEYSELECT เพื่อเลือกตัวอย่างสุ่มอย่างง่าย

เราสามารถใช้ไวยากรณ์ต่อไปนี้เพื่อเลือก ตัวอย่างสุ่มอย่างง่าย ของการสังเกต 5 รายการจากชุดข้อมูล:

 proc surveyselect data =my_data
out =my_sample
    method =srs /*use simple random sampling*/
    n =5 /*select a total of 5 observations*/
    seed =1; /*set seed to make this example reproducible*/
run ;

/*view sample*/
proc print data =my_sample;

ตัวอย่างผลลัพธ์ประกอบด้วย การสังเกต 5 รายการแบบสุ่มเลือกจากชุดข้อมูล

ตัวอย่างที่ 2: ใช้ PROC SURVEYSELECT เพื่อเลือกตัวอย่างแบบสุ่มแบบแบ่งชั้น

เราสามารถใช้ไวยากรณ์ต่อไปนี้เพื่อสุ่มตัวอย่างแบบแบ่งชั้น โดยสุ่มเลือกข้อสังเกต 2 รายการจากแต่ละทีมเพื่อรวมไว้ในตัวอย่าง:

 proc surveyselect data =my_data
out =my_sample
    method =srs /*use simple random sampling within strata*/
    n =2 /*select 2 observations from each strata*/
    seed =1; /*set seed to make this example reproducible*/
strata grouping_var; /*specify variable to use for stratification*/
run ;

/*view sample*/
proc print data =my_sample;

ตัวอย่างที่ได้ประกอบด้วย ข้อสังเกต ที่สุ่มเลือก 2 รายการจากแต่ละทีม

ที่เกี่ยวข้อง: การสุ่มตัวอย่างแบบคลัสเตอร์และการสุ่มตัวอย่างแบบแบ่งชั้น: อะไรคือความแตกต่าง?

ตัวอย่างที่ 3: ใช้ PROC SURVEYSELECT เพื่อเลือกตัวอย่างแบบสุ่มรวมกลุ่ม

เราสามารถใช้ไวยากรณ์ต่อไปนี้เพื่อทำการสุ่มตัวอย่างแบบคลัสเตอร์ โดยเราใช้ทีมเป็นคลัสเตอร์และสุ่มเลือก 2 คลัสเตอร์ และรวมแต่ละข้อสังเกตจากคลัสเตอร์เหล่านี้ไว้ในตัวอย่าง:

 proc surveyselect data =my_data
out =my_sample
    n =2 /*select a total of 2 clusters*/
    seed =1; /*set seed to make this example reproducible*/
clustergrouping_var ; /*specify variable to use for clustering*/
run ;

/*view sample*/
proc print data =my_sample;

ตัวอย่างนี้ประกอบด้วยข้อสังเกตทั้งหมดจากทีม A และ B ซึ่งเป็น “กลุ่ม” ที่ได้รับการสุ่มเลือกสองกลุ่ม

หมายเหตุ : คุณสามารถดูเอกสาร PROC SURVEYSELECT ฉบับเต็มได้ ที่นี่

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้จะอธิบายวิธีดำเนินการงานทั่วไปอื่นๆ ใน SAS:

วิธีการคำนวณสถิติเชิงพรรณนาใน SAS
วิธีสร้างตารางความถี่ใน SAS
วิธีการคำนวณเปอร์เซ็นไทล์ใน SAS
วิธีสร้าง PivotTable ใน SAS

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *