Jak wybrać losową próbkę w sas: z przykładami


Oto dwa najczęstsze sposoby wybierania prostej losowej próbki wierszy ze zbioru danych w SAS-ie:

Metoda 1: Wybierz losową próbkę na podstawie rozmiaru próbki

 proc surveyselect data =original_data
    out =random_sample
    method =srs /*specify simple random sampling as sampling method*/
    sampsize =3 /*select 3 observations randomly*/
    seed =123; /*set seed to make this example reproducible*/
run ;

Metoda 2: Wybierz losową próbkę, korzystając z proporcji wszystkich obserwacji

 proc surveyselect data =original_data
    out =random_sample
    method =srs /*specify simple random sampling as sampling method*/
    samprate =0.2 /*select 20% of all observations randomly*/
    seed =123; /*set seed to make this example reproducible*/
run ;

Poniższe przykłady pokazują, jak używać każdej metody z następującym zbiorem danych w SAS-owym:

 /*create dataset*/
data original_data;
    input team $pointsrebounds;
    datalines ;
Warriors 25 8
Wizards 18 12
Rockets 22 6
Celtics 24 11
Thunder 27 14
Spurs 33 19
Nets 31 20
Mavericks 34 10
Kings 22 11
Pelicans 39 23
;
run ;

/*view dataset*/
proc print data = original_data; 

Przykład 1: Wybierz losową próbkę na podstawie rozmiaru próbki

Poniższy kod pokazuje, jak wybrać losową próbkę obserwacji ze zbioru danych przy użyciu próby o wielkości n=3:

 /*select random sample*/
proc surveyselect data =original_data
    out =random_sample
    method =srs
    sampsize =3
    seed =123;
run ;

/*view random sample*/
proc print data =random_sample; 

Widzimy, że z oryginalnego zbioru danych wybrano losowo trzy wiersze.

Przykład 2: Wybierz losową próbkę, korzystając z proporcji wszystkich obserwacji

Poniższy kod pokazuje, jak wybrać losową próbkę obserwacji ze zbioru danych za pomocą funkcji samprate , aby określić, że chcemy, aby losowa próbka reprezentowała 20% wszystkich oryginalnych obserwacji:

 /*select random sample*/
proc surveyselect data =original_data
    out =random_sample
    method =srs
    samprate =0.2
    seed =123;
run ;

/*view random sample*/
proc print data =random_sample;

Widzimy, że 20% wszystkich obserwacji (20% * 10 obserwacji = 2 ) z oryginalnego zbioru danych zostało losowo wybranych do naszej próby.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w SAS-ie:

Jak korzystać ze podsumowania procedur w SAS-ie
Jak zmienić nazwy zmiennych w SAS-ie
Jak utworzyć nowe zmienne w SAS-ie

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *