Jak podzielić dane w sas-ie (3 przykłady)


Oto trzy najpopularniejsze sposoby dzielenia zbioru danych w SAS-ie:

Metoda 1: Wybierz, które kolumny zachować

 data new_data;
    set original_data;
    keep var1 var3;
run ;

Metoda 2: Wybierz, które kolumny chcesz usunąć

 data new_data;
    set original_data;
    dropvar4 ;
run ;

Metoda 3: Wybierz wiersze, które chcesz zachować, w zależności od warunku

 data new_data;
    set original_data;
    if var1 < 25 then delete;
run ;

Poniższe przykłady pokazują, jak używać każdej metody z następującym zbiorem danych w SAS-owym:

 /*create dataset*/
data original_data;
    input team $pointsrebounds;
    datalines ;
Warriors 25 8
Wizards 18 12
Rockets 22 6
Celtics 24 11
Thunder 27 14
Spurs 33 19
Nets 31 20
;
run ;

/*view dataset*/
proc print data = original_data; 

Przykład 1: Wybierz, które kolumny zachować

Poniższy kod pokazuje, jak podzielić zbiór danych na podzbiór za pomocą instrukcji KEEP , aby zachować tylko niektóre kolumny:

 /*create new dataset*/
data new_data;
    set original_data;
    keep team points;
run ;

/*view new dataset*/
proc print data = new_data;

Przykład 2: Wybierz kolumny do usunięcia

Poniższy kod pokazuje, jak podzielić zbiór danych na podzbiór za pomocą instrukcji DROP w celu usunięcia określonych kolumn:

 /*create new dataset*/
data new_data;
    set original_data;
    drop points;
run ;

/*view new dataset*/
proc print data = new_data;

Przykład 3: Wybierz, które wiersze chcesz zachować, na podstawie warunku

Poniższy kod pokazuje, jak podzielić zbiór danych na podzbiór za pomocą instrukcji DELETE w celu usunięcia określonych wierszy ze zbioru danych, których wartość w kolumnie punktowej jest mniejsza niż 25:

 /*create new dataset*/
data new_data;
    set original_data;
    if points < 25 then delete;
run ;

/*view new dataset*/
proc print data = new_data;

Możesz także użyć OR| ”, aby usunąć linie, w których punkty są mniejsze niż 25 lub zbiórki są mniejsze niż 10:

 /*create new dataset*/
data new_data;
    set original_data;
    if points < 25 | rebounds < 10 then delete;
run ;

/*view new dataset*/
proc print data = new_data; 

Możesz także użyć operatora AND& „, aby usunąć linie, w których liczba punktów jest mniejsza niż 25 , a odbicia są mniejsze niż 10:

 /*create new dataset*/
data new_data;
    set original_data;
    if points < 25 & rebounds < 10 then delete;
run ;

/*view new dataset*/
proc print data = new_data; 

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w SAS-ie:

Jak zmienić nazwy zmiennych w SAS-ie
Jak utworzyć nowe zmienne w SAS-ie
Jak zamienić znaki w ciągu w SAS-ie

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *