Jak podzielić dane w sas-ie (3 przykłady)
Oto trzy najpopularniejsze sposoby dzielenia zbioru danych w SAS-ie:
Metoda 1: Wybierz, które kolumny zachować
data new_data;
set original_data;
keep var1 var3;
run ;
Metoda 2: Wybierz, które kolumny chcesz usunąć
data new_data;
set original_data;
dropvar4 ;
run ;
Metoda 3: Wybierz wiersze, które chcesz zachować, w zależności od warunku
data new_data;
set original_data;
if var1 < 25 then delete;
run ;
Poniższe przykłady pokazują, jak używać każdej metody z następującym zbiorem danych w SAS-owym:
/*create dataset*/
data original_data;
input team $pointsrebounds;
datalines ;
Warriors 25 8
Wizards 18 12
Rockets 22 6
Celtics 24 11
Thunder 27 14
Spurs 33 19
Nets 31 20
;
run ;
/*view dataset*/
proc print data = original_data;
Przykład 1: Wybierz, które kolumny zachować
Poniższy kod pokazuje, jak podzielić zbiór danych na podzbiór za pomocą instrukcji KEEP , aby zachować tylko niektóre kolumny:
/*create new dataset*/
data new_data;
set original_data;
keep team points;
run ;
/*view new dataset*/
proc print data = new_data;
Przykład 2: Wybierz kolumny do usunięcia
Poniższy kod pokazuje, jak podzielić zbiór danych na podzbiór za pomocą instrukcji DROP w celu usunięcia określonych kolumn:
/*create new dataset*/
data new_data;
set original_data;
drop points;
run ;
/*view new dataset*/
proc print data = new_data;
Przykład 3: Wybierz, które wiersze chcesz zachować, na podstawie warunku
Poniższy kod pokazuje, jak podzielić zbiór danych na podzbiór za pomocą instrukcji DELETE w celu usunięcia określonych wierszy ze zbioru danych, których wartość w kolumnie punktowej jest mniejsza niż 25:
/*create new dataset*/
data new_data;
set original_data;
if points < 25 then delete;
run ;
/*view new dataset*/
proc print data = new_data;
Możesz także użyć OR „ | ”, aby usunąć linie, w których punkty są mniejsze niż 25 lub zbiórki są mniejsze niż 10:
/*create new dataset*/
data new_data;
set original_data;
if points < 25 | rebounds < 10 then delete;
run ;
/*view new dataset*/
proc print data = new_data;
Możesz także użyć operatora AND ” & „, aby usunąć linie, w których liczba punktów jest mniejsza niż 25 , a odbicia są mniejsze niż 10:
/*create new dataset*/
data new_data;
set original_data;
if points < 25 & rebounds < 10 then delete;
run ;
/*view new dataset*/
proc print data = new_data;
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w SAS-ie:
Jak zmienić nazwy zmiennych w SAS-ie
Jak utworzyć nowe zmienne w SAS-ie
Jak zamienić znaki w ciągu w SAS-ie