Możesz użyć sortowania proc w SAS-ie, aby szybko usunąć zduplikowane wiersze ze zbioru danych. W tej procedurze zastosowano następującą podstawową składnię: proc sort data =original_data out =no_dups_data nodupkey ; by _all_; run; Należy pamiętać, że argument by określa, które kolumny mają...
Test U Manna-Whitneya (czasami nazywany testem sumy rang Wilcoxona) służy do porównywania różnic między dwiema próbami, gdy rozkład próbek nie ma rozkładu normalnego, a rozmiary próbek są małe (n < 30). Uważa się, że jest to nieparametryczny odpowiednik testu t dla...
Rozkład Poissona i rozkład normalny to dwa najczęściej używane rozkłady prawdopodobieństwa w statystyce. Ten samouczek zawiera szybkie wyjaśnienie każdej dystrybucji, a także dwie kluczowe różnice między dystrybucjami. Przegląd: rozkład Poissona Rozkład Poissona opisuje prawdopodobieństwo uzyskania k sukcesów w zadanym przedziale czasu....
W statystyce normalizacja kwantyli jest metodą, która sprawia, że dwa rozkłady są identyczne pod względem właściwości statystycznych. Poniższy przykład pokazuje, jak przeprowadzić normalizację kwantyli w R. Przykład: normalizacja kwantyli w R Załóżmy, że tworzymy następującą ramkę danych w R zawierającą dwie...
Do obliczenia rangi percentylowej zgrupowanych danych można użyć poniższego wzoru: Ranga percentylowa = L + (RN/100 – M) / F * C Złoto: L : Dolna granica przedziału zawierającego rangę percentyla O : Ranga percentylowa N : Całkowita częstotliwość M :...
Za pomocą poniższego wzoru można obliczyć percentyl rozkładu normalnego, mając średnią i odchylenie standardowe: Wartość percentylowa = μ + zσ Złoto: μ : Średnia z : wynik z tabeli z, który odpowiada wartości percentyla σ : odchylenie standardowe Poniższe przykłady pokazują,...
Funkcji zamiany() w R można użyć do zastąpienia określonych elementów wektora nowymi wartościami. Ta funkcja wykorzystuje następującą składnię: zamień (x, lista, wartości) Złoto: x : nazwa wektora lista : Elementy do zastąpienia wartości : Wartości zastępcze Poniższe przykłady pokazują, jak w...
Prosta regresja liniowa to technika, którą możemy wykorzystać do zrozumienia związku między zmienną predykcyjną a zmienną odpowiedzi . Technika ta znajduje linię, która najlepiej „pasuje” do danych i przyjmuje następującą postać: ŷ = b 0 + b 1 x Złoto: ŷ...
Możesz użyć proc sgplot , aby szybko utworzyć wykres rozrzutu z linią regresji w SAS-ie. Poniższe przykłady pokazują, jak zastosować tę procedurę w praktyce. Przykład 1: Utwórz podstawowy wykres punktowy z linią regresji Poniższy kod pokazuje, jak utworzyć podstawowy wykres rozrzutu...
Wielokrotna regresja liniowa to metoda, którą możemy wykorzystać do zrozumienia związku między dwiema lub większą liczbą zmiennych predykcyjnych azmienną odpowiedzi . W tym samouczku wyjaśniono, jak przeprowadzić wielokrotną regresję liniową w SAS-ie. Krok 1: Utwórz dane Załóżmy, że chcemy dopasować model...