Przewodnik - Statorials

Jak obliczyć średnią, medianę i tryb & w sas

Przez Benjamin Anderson 20 lipca, 2023 Przewodnik 0 komentarzy

Możesz użyć jednowymiarowego proc , aby szybko obliczyć średnią, medianę i modę zmiennych w SAS-ie. W tej procedurze zastosowano następującą podstawową składnię: proc univariate data =my_data; run ; Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce. Przykład: oblicz średnią, medianę...

[Kontynuuj czytanie...]

Jak policzyć brakujące wartości w sas-ie: z przykładami

Przez Benjamin Anderson 20 lipca, 2023 Przewodnik 0 komentarzy

Możesz użyć następujących metod, aby policzyć liczbę brakujących wartości w SAS-ie: Metoda 1: Policz brakujące wartości dla zmiennych numerycznych proc means data =my_data NMISS ; run ; Metoda 2: Policz brakujące wartości dla zmiennych znakowych proc sql; select nmiss(char1) as char1_miss,...

[Kontynuuj czytanie...]

Jak utworzyć krzywą roc w sas

Przez Benjamin Anderson 20 lipca, 2023 Przewodnik 0 komentarzy

Regresja logistyczna to metoda, której możemy użyć do dopasowania modelu regresji, gdy zmienna odpowiedzi jest binarna. Aby ocenić, jak dobrze model regresji logistycznej pasuje do zbioru danych, możemy przyjrzeć się następującym dwóm metrykom: Czułość: prawdopodobieństwo, że model przewiduje pozytywny wynik obserwacji,...

[Kontynuuj czytanie...]

Problem monty'ego halla: proste wyjaśnienie wizualne

Przez Benjamin Anderson 20 lipca, 2023 Przewodnik 0 komentarzy

W starym teleturnieju zatytułowanym Let’s Make a Deal gospodarz Monty Hall przedstawił uczestnikom troje drzwi. Na jednych drzwiach znajdowała się nagroda, na pozostałych dwóch nie. Monty prosił uczestnika o wybranie, które drzwi jego zdaniem zawierają nagrodę. Gdy uczestnik wybrał drzwi, Monty...

[Kontynuuj czytanie...]

Kompletny przewodnik po pętlach do w sas-ie

Przez Benjamin Anderson 20 lipca, 2023 Przewodnik 0 komentarzy

Pętli DO w SAS-ie można użyć do wykonania akcji określoną liczbę razy. W SAS-ie istnieją trzy podstawowe pętle DO: 1. ZROB pętlę data data1; x = 0; do i = 1 to 10; x = i*4; output ; end ; run...

[Kontynuuj czytanie...]

Jak korzystać z pierwszego. wreszcie. zmienne w sas-ie

Przez Benjamin Anderson 20 lipca, 2023 Przewodnik 0 komentarzy

Możesz użyć PIERWSZEGO. i OSTATNI. w SAS, aby zidentyfikować pierwsze prace i ostatnie obserwacje według grup w zbiorze danych SAS. Oto podsumowanie działania każdej funkcji: FIRST.nazwa_zmiennej przypisuje wartość 1 pierwszej obserwacji w grupie i wartość 0 wszystkim pozostałym obserwacjom w grupie....

[Kontynuuj czytanie...]

Jak używać select-when w sas-ie (z przykładem)

Przez Benjamin Anderson 20 lipca, 2023 Przewodnik 0 komentarzy

Za pomocą instrukcji SELECT-WHEN w SAS-ie możesz przypisać wartości do nowej zmiennej na podstawie wartości istniejącej zmiennej kategorycznej w zbiorze danych. W tej instrukcji zastosowano następującą podstawową składnię: data new_data; set my_data; select (Existing_Column); when ('value1') New_Column= 1 ; when ('value2')...

[Kontynuuj czytanie...]

Jak policzyć unikalne wartości według grupy w r (z przykładami)

Przez Benjamin Anderson 20 lipca, 2023 Przewodnik 0 komentarzy

Możesz użyć następujących metod, aby policzyć liczbę unikalnych wartości na grupę w R: Metoda 1: Użyj podstawy R results <- aggregate(data=df, values_var~group_var, function (x) length ( unique (x))) Metoda 2: użyj dplyr library (dplyr) results <- df %>% group_by(group_var) %>% summarize(count...

[Kontynuuj czytanie...]

Jak ustawić liczbę pojemników dla histogramu w ggplot2

Przez Benjamin Anderson 20 lipca, 2023 Przewodnik 0 komentarzy

Możesz użyć argumentu bins , aby określić liczbę pojemników do użycia w histogramie w ggplot2 : library (ggplot2) ggplot(df, aes (x=x)) + geom_histogram(bins= 10 ) Poniższe przykłady pokazują, jak zastosować ten argument w praktyce. Przykład: ustaw liczbę przedziałów dla histogramu w...

[Kontynuuj czytanie...]

Jak filtrować według daty za pomocą dplyr

Przez Benjamin Anderson 20 lipca, 2023 Przewodnik 0 komentarzy

Do filtrowania ramki danych według dat w R przy użyciu pakietu dplyr można użyć następujących metod: Metoda 1: Filtruj wiersze po dacie df %>% filter(date_column > ' 2022-01-01 ') Metoda 2: Filtruj wiersze przed datą df %>% filter(date_column < ' 2022-01-01...

[Kontynuuj czytanie...]

Kategoria: Przewodnik