Możesz użyć jednowymiarowego proc , aby szybko obliczyć średnią, medianę i modę zmiennych w SAS-ie. W tej procedurze zastosowano następującą podstawową składnię: proc univariate data =my_data; run ; Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce. Przykład: oblicz średnią, medianę...
Możesz użyć następujących metod, aby policzyć liczbę brakujących wartości w SAS-ie: Metoda 1: Policz brakujące wartości dla zmiennych numerycznych proc means data =my_data NMISS ; run ; Metoda 2: Policz brakujące wartości dla zmiennych znakowych proc sql; select nmiss(char1) as char1_miss,...
Regresja logistyczna to metoda, której możemy użyć do dopasowania modelu regresji, gdy zmienna odpowiedzi jest binarna. Aby ocenić, jak dobrze model regresji logistycznej pasuje do zbioru danych, możemy przyjrzeć się następującym dwóm metrykom: Czułość: prawdopodobieństwo, że model przewiduje pozytywny wynik obserwacji,...
W starym teleturnieju zatytułowanym Let’s Make a Deal gospodarz Monty Hall przedstawił uczestnikom troje drzwi. Na jednych drzwiach znajdowała się nagroda, na pozostałych dwóch nie. Monty prosił uczestnika o wybranie, które drzwi jego zdaniem zawierają nagrodę. Gdy uczestnik wybrał drzwi, Monty...
Pętli DO w SAS-ie można użyć do wykonania akcji określoną liczbę razy. W SAS-ie istnieją trzy podstawowe pętle DO: 1. ZROB pętlę data data1; x = 0; do i = 1 to 10; x = i*4; output ; end ; run...
Możesz użyć PIERWSZEGO. i OSTATNI. w SAS, aby zidentyfikować pierwsze prace i ostatnie obserwacje według grup w zbiorze danych SAS. Oto podsumowanie działania każdej funkcji: FIRST.nazwa_zmiennej przypisuje wartość 1 pierwszej obserwacji w grupie i wartość 0 wszystkim pozostałym obserwacjom w grupie....
Za pomocą instrukcji SELECT-WHEN w SAS-ie możesz przypisać wartości do nowej zmiennej na podstawie wartości istniejącej zmiennej kategorycznej w zbiorze danych. W tej instrukcji zastosowano następującą podstawową składnię: data new_data; set my_data; select (Existing_Column); when ('value1') New_Column= 1 ; when ('value2')...
Możesz użyć następujących metod, aby policzyć liczbę unikalnych wartości na grupę w R: Metoda 1: Użyj podstawy R results <- aggregate(data=df, values_var~group_var, function (x) length ( unique (x))) Metoda 2: użyj dplyr library (dplyr) results <- df %>% group_by(group_var) %>% summarize(count...
Możesz użyć argumentu bins , aby określić liczbę pojemników do użycia w histogramie w ggplot2 : library (ggplot2) ggplot(df, aes (x=x)) + geom_histogram(bins= 10 ) Poniższe przykłady pokazują, jak zastosować ten argument w praktyce. Przykład: ustaw liczbę przedziałów dla histogramu w...
Do filtrowania ramki danych według dat w R przy użyciu pakietu dplyr można użyć następujących metod: Metoda 1: Filtruj wiersze po dacie df %>% filter(date_column > ' 2022-01-01 ') Metoda 2: Filtruj wiersze przed datą df %>% filter(date_column < ' 2022-01-01...