วิธีใช้ proc surveyselect ใน sas (พร้อมตัวอย่าง)
คุณสามารถใช้ PROC SURVEYSELECT เพื่อเลือกตัวอย่างแบบสุ่มจากชุดข้อมูลใน SAS
ต่อไปนี้เป็นวิธีทั่วไปสามวิธีในการใช้ขั้นตอนนี้ในทางปฏิบัติ:
ตัวอย่างที่ 1: ใช้ PROC SURVEYSELECT เพื่อเลือกตัวอย่างสุ่มอย่างง่าย
proc surveyselect data =my_data
out =my_sample
method =srs /*use simple random sampling*/
n =5 /*select a total of 5 observations*/
seed =1; /*set seed to make this example reproducible*/
run ;
ตัวอย่างนี้เลือกการสังเกตแบบสุ่ม 5 รายการจากชุดข้อมูล
ตัวอย่างที่ 2: ใช้ PROC SURVEYSELECT เพื่อเลือกตัวอย่างแบบสุ่มแบบแบ่งชั้น
proc surveyselect data =my_data
out =my_sample
method =srs /*use simple random sampling*/
n =2 /*select 2 observations from each strata*/
seed =1; /*set seed to make this example reproducible*/
strata grouping_var; /*specify variable to use for stratification*/
run ;
ตัวอย่างนี้จะเลือกการสังเกตแบบสุ่ม 2 รายการจากแต่ละชั้นข้อมูลที่ไม่ซ้ำกันของชุดข้อมูล
คำสั่ง strata ระบุตัวแปรที่จะใช้สำหรับการแบ่งชั้น
ตัวอย่างที่ 3: ใช้ PROC SURVEYSELECT เพื่อเลือกตัวอย่างแบบสุ่มรวมกลุ่ม
proc surveyselect data =my_data
out =my_sample
n =2 /*select 2 clusters*/
seed =1; /*set seed to make this example reproducible*/
clustergrouping_var ; /*specify variable to use for stratification*/
run ;
ตัวอย่างเฉพาะนี้จะเลือกกลุ่มสุ่ม 2 กลุ่มจากชุดข้อมูล และรวมทุกการสังเกตจากทุกกลุ่มในกลุ่มตัวอย่าง
คำสั่ง คลัสเตอร์ ระบุตัวแปรที่จะใช้สำหรับการทำคลัสเตอร์
ตัวอย่างต่อไปนี้แสดงวิธีการใช้แต่ละวิธีในทางปฏิบัติกับชุดข้อมูลต่อไปนี้ใน SAS ซึ่งมีข้อมูลเกี่ยวกับผู้เล่นบาสเกตบอลจากทีมต่างๆ:
/*create dataset*/
data my_data;
input team $points;
datalines ;
AT 12
At 14
At 22
At 35
At 40
B 12
B 10
B29
B 33
C40
C25
C 11
C 10
C15
;
run ;
/*view dataset*/
proc print data = my_data;
ตัวอย่างที่ 1: ใช้ PROC SURVEYSELECT เพื่อเลือกตัวอย่างสุ่มอย่างง่าย
เราสามารถใช้ไวยากรณ์ต่อไปนี้เพื่อเลือก ตัวอย่างสุ่มอย่างง่าย ของการสังเกต 5 รายการจากชุดข้อมูล:
proc surveyselect data =my_data
out =my_sample
method =srs /*use simple random sampling*/
n =5 /*select a total of 5 observations*/
seed =1; /*set seed to make this example reproducible*/
run ;
/*view sample*/
proc print data =my_sample;
ตัวอย่างผลลัพธ์ประกอบด้วย การสังเกต 5 รายการแบบสุ่มเลือกจากชุดข้อมูล
ตัวอย่างที่ 2: ใช้ PROC SURVEYSELECT เพื่อเลือกตัวอย่างแบบสุ่มแบบแบ่งชั้น
เราสามารถใช้ไวยากรณ์ต่อไปนี้เพื่อสุ่มตัวอย่างแบบแบ่งชั้น โดยสุ่มเลือกข้อสังเกต 2 รายการจากแต่ละทีมเพื่อรวมไว้ในตัวอย่าง:
proc surveyselect data =my_data
out =my_sample
method =srs /*use simple random sampling within strata*/
n =2 /*select 2 observations from each strata*/
seed =1; /*set seed to make this example reproducible*/
strata grouping_var; /*specify variable to use for stratification*/
run ;
/*view sample*/
proc print data =my_sample;
ตัวอย่างที่ได้ประกอบด้วย ข้อสังเกต ที่สุ่มเลือก 2 รายการจากแต่ละทีม
ที่เกี่ยวข้อง: การสุ่มตัวอย่างแบบคลัสเตอร์และการสุ่มตัวอย่างแบบแบ่งชั้น: อะไรคือความแตกต่าง?
ตัวอย่างที่ 3: ใช้ PROC SURVEYSELECT เพื่อเลือกตัวอย่างแบบสุ่มรวมกลุ่ม
เราสามารถใช้ไวยากรณ์ต่อไปนี้เพื่อทำการสุ่มตัวอย่างแบบคลัสเตอร์ โดยเราใช้ทีมเป็นคลัสเตอร์และสุ่มเลือก 2 คลัสเตอร์ และรวมแต่ละข้อสังเกตจากคลัสเตอร์เหล่านี้ไว้ในตัวอย่าง:
proc surveyselect data =my_data
out =my_sample
n =2 /*select a total of 2 clusters*/
seed =1; /*set seed to make this example reproducible*/
clustergrouping_var ; /*specify variable to use for clustering*/
run ;
/*view sample*/
proc print data =my_sample;
ตัวอย่างนี้ประกอบด้วยข้อสังเกตทั้งหมดจากทีม A และ B ซึ่งเป็น “กลุ่ม” ที่ได้รับการสุ่มเลือกสองกลุ่ม
หมายเหตุ : คุณสามารถดูเอกสาร PROC SURVEYSELECT ฉบับเต็มได้ ที่นี่
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้จะอธิบายวิธีดำเนินการงานทั่วไปอื่นๆ ใน SAS:
วิธีการคำนวณสถิติเชิงพรรณนาใน SAS
วิธีสร้างตารางความถี่ใน SAS
วิธีการคำนวณเปอร์เซ็นไทล์ใน SAS
วิธีสร้าง PivotTable ใน SAS