Jak korzystać z proc surveyselect w sas-ie (z przykładami)


Możesz użyć PROC SURVEYSELECT , aby wybrać losową próbkę ze zbioru danych w SAS-ie.

Oto trzy popularne sposoby wykorzystania tej procedury w praktyce:

Przykład 1: Użyj PROC SURVEYSELECT, aby wybrać prostą próbkę losową

 proc surveyselect data =my_data
out =my_sample
    method =srs /*use simple random sampling*/
    n =5 /*select a total of 5 observations*/
    seed =1; /*set seed to make this example reproducible*/
run ;

W tym konkretnym przykładzie wybrano 5 losowych obserwacji ze zbioru danych.

Przykład 2: Użyj PROC SURVEYSELECT, aby wybrać warstwową próbkę losową

 proc surveyselect data =my_data
out =my_sample
    method =srs /*use simple random sampling*/
    n =2 /*select 2 observations from each strata*/
    seed =1; /*set seed to make this example reproducible*/
strata grouping_var; /*specify variable to use for stratification*/
run ;

W tym konkretnym przykładzie wybrano 2 losowe obserwacje z każdej unikalnej warstwy zbioru danych.

Instrukcja strata określa zmienną używaną do stratyfikacji.

Przykład 3: Użyj PROC SURVEYSELECT, aby wybrać zbiorczą próbkę losową

 proc surveyselect data =my_data
out =my_sample
    n =2 /*select 2 clusters*/
    seed =1; /*set seed to make this example reproducible*/
clustergrouping_var ; /*specify variable to use for stratification*/
run ;

W tym konkretnym przykładzie wybierane są 2 losowe skupienia ze zbioru danych i uwzględniane są wszystkie obserwacje z każdego skupienia w próbie.

Instrukcja klastra określa zmienną, która ma być używana do grupowania.

Poniższe przykłady pokazują, jak zastosować każdą metodę w praktyce z następującym zbiorem danych w SAS-ie, który zawiera informacje o koszykarzach z różnych drużyn:

 /*create dataset*/
data my_data;
    input team $points;
    datalines ;
AT 12
At 14
At 22
At 35
At 40
B 12
B 10
B29
B 33
C40
C25
C 11
C 10
C15
;
run ;

/*view dataset*/
proc print data = my_data; 

Przykład 1: Użyj PROC SURVEYSELECT, aby wybrać prostą próbkę losową

Aby wybrać prostą losową próbkę 5 obserwacji ze zbioru danych, możemy zastosować następującą składnię:

 proc surveyselect data =my_data
out =my_sample
    method =srs /*use simple random sampling*/
    n =5 /*select a total of 5 observations*/
    seed =1; /*set seed to make this example reproducible*/
run ;

/*view sample*/
proc print data =my_sample;

Otrzymana próbka zawiera 5 obserwacji wybranych losowo ze zbioru danych.

Przykład 2: Użyj PROC SURVEYSELECT, aby wybrać warstwową próbkę losową

Możemy zastosować następującą składnię, aby przeprowadzić losowe próbkowanie warstwowe, w którym z każdego zespołu wybierane są losowo 2 obserwacje, które mają zostać włączone do próby:

 proc surveyselect data =my_data
out =my_sample
    method =srs /*use simple random sampling within strata*/
    n =2 /*select 2 observations from each strata*/
    seed =1; /*set seed to make this example reproducible*/
strata grouping_var; /*specify variable to use for stratification*/
run ;

/*view sample*/
proc print data =my_sample;

Otrzymana próbka zawiera 2 losowo wybrane obserwacje z każdego zespołu.

Powiązane: Próbkowanie klastrowe i próbkowanie warstwowe: jaka jest różnica?

Przykład 3: Użyj PROC SURVEYSELECT, aby wybrać zbiorczą próbkę losową

Możemy użyć następującej składni, aby przeprowadzić losowe próbkowanie klastrowe, w którym używamy zespołów jako klastrów i losowo wybieramy 2 skupienia, a każdą obserwację z tych skupień uwzględniamy w próbie:

 proc surveyselect data =my_data
out =my_sample
    n =2 /*select a total of 2 clusters*/
    seed =1; /*set seed to make this example reproducible*/
clustergrouping_var ; /*specify variable to use for clustering*/
run ;

/*view sample*/
proc print data =my_sample;

Ta konkretna próbka zawiera wszystkie obserwacje z zespołów A i B, które były dwoma losowo wybranymi „skupiskami”.

Uwaga : pełną dokumentację PROC SURVEYSELECT można znaleźć tutaj .

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w SAS-ie:

Jak obliczyć statystyki opisowe w SAS-ie
Jak tworzyć tabele częstości w SAS-ie
Jak obliczyć percentyle w SAS-ie
Jak tworzyć tabele przestawne w SAS-ie

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *