Jak korzystać z proc surveyselect w sas-ie (z przykładami)
Możesz użyć PROC SURVEYSELECT , aby wybrać losową próbkę ze zbioru danych w SAS-ie.
Oto trzy popularne sposoby wykorzystania tej procedury w praktyce:
Przykład 1: Użyj PROC SURVEYSELECT, aby wybrać prostą próbkę losową
proc surveyselect data =my_data
out =my_sample
method =srs /*use simple random sampling*/
n =5 /*select a total of 5 observations*/
seed =1; /*set seed to make this example reproducible*/
run ;
W tym konkretnym przykładzie wybrano 5 losowych obserwacji ze zbioru danych.
Przykład 2: Użyj PROC SURVEYSELECT, aby wybrać warstwową próbkę losową
proc surveyselect data =my_data
out =my_sample
method =srs /*use simple random sampling*/
n =2 /*select 2 observations from each strata*/
seed =1; /*set seed to make this example reproducible*/
strata grouping_var; /*specify variable to use for stratification*/
run ;
W tym konkretnym przykładzie wybrano 2 losowe obserwacje z każdej unikalnej warstwy zbioru danych.
Instrukcja strata określa zmienną używaną do stratyfikacji.
Przykład 3: Użyj PROC SURVEYSELECT, aby wybrać zbiorczą próbkę losową
proc surveyselect data =my_data
out =my_sample
n =2 /*select 2 clusters*/
seed =1; /*set seed to make this example reproducible*/
clustergrouping_var ; /*specify variable to use for stratification*/
run ;
W tym konkretnym przykładzie wybierane są 2 losowe skupienia ze zbioru danych i uwzględniane są wszystkie obserwacje z każdego skupienia w próbie.
Instrukcja klastra określa zmienną, która ma być używana do grupowania.
Poniższe przykłady pokazują, jak zastosować każdą metodę w praktyce z następującym zbiorem danych w SAS-ie, który zawiera informacje o koszykarzach z różnych drużyn:
/*create dataset*/
data my_data;
input team $points;
datalines ;
AT 12
At 14
At 22
At 35
At 40
B 12
B 10
B29
B 33
C40
C25
C 11
C 10
C15
;
run ;
/*view dataset*/
proc print data = my_data;
Przykład 1: Użyj PROC SURVEYSELECT, aby wybrać prostą próbkę losową
Aby wybrać prostą losową próbkę 5 obserwacji ze zbioru danych, możemy zastosować następującą składnię:
proc surveyselect data =my_data
out =my_sample
method =srs /*use simple random sampling*/
n =5 /*select a total of 5 observations*/
seed =1; /*set seed to make this example reproducible*/
run ;
/*view sample*/
proc print data =my_sample;
Otrzymana próbka zawiera 5 obserwacji wybranych losowo ze zbioru danych.
Przykład 2: Użyj PROC SURVEYSELECT, aby wybrać warstwową próbkę losową
Możemy zastosować następującą składnię, aby przeprowadzić losowe próbkowanie warstwowe, w którym z każdego zespołu wybierane są losowo 2 obserwacje, które mają zostać włączone do próby:
proc surveyselect data =my_data
out =my_sample
method =srs /*use simple random sampling within strata*/
n =2 /*select 2 observations from each strata*/
seed =1; /*set seed to make this example reproducible*/
strata grouping_var; /*specify variable to use for stratification*/
run ;
/*view sample*/
proc print data =my_sample;
Otrzymana próbka zawiera 2 losowo wybrane obserwacje z każdego zespołu.
Powiązane: Próbkowanie klastrowe i próbkowanie warstwowe: jaka jest różnica?
Przykład 3: Użyj PROC SURVEYSELECT, aby wybrać zbiorczą próbkę losową
Możemy użyć następującej składni, aby przeprowadzić losowe próbkowanie klastrowe, w którym używamy zespołów jako klastrów i losowo wybieramy 2 skupienia, a każdą obserwację z tych skupień uwzględniamy w próbie:
proc surveyselect data =my_data
out =my_sample
n =2 /*select a total of 2 clusters*/
seed =1; /*set seed to make this example reproducible*/
clustergrouping_var ; /*specify variable to use for clustering*/
run ;
/*view sample*/
proc print data =my_sample;
Ta konkretna próbka zawiera wszystkie obserwacje z zespołów A i B, które były dwoma losowo wybranymi „skupiskami”.
Uwaga : pełną dokumentację PROC SURVEYSELECT można znaleźć tutaj .
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w SAS-ie:
Jak obliczyć statystyki opisowe w SAS-ie
Jak tworzyć tabele częstości w SAS-ie
Jak obliczyć percentyle w SAS-ie
Jak tworzyć tabele przestawne w SAS-ie