Rozkład trójkątny jest ciągłym rozkładem prawdopodobieństwa z funkcją gęstości prawdopodobieństwa w kształcie trójkąta. Jest ona definiowana przez trzy wartości: Wartość minimalna ma Maksymalna wartość B Maksymalna wartość c Nazwa rozkładu wzięła się stąd, że funkcja gęstości prawdopodobieństwa ma kształt trójkąta. Okazuje...
I Morana to sposób pomiaru autokorelacji przestrzennej. Mówiąc najprościej, jest to sposób na ilościowe określenie, jak blisko wartości są skupione w przestrzeni 2D. Jest często stosowany w geografii i informatyce geograficznej (GIS) do pomiaru stopnia zgrupowania różnych obiektów na mapie, takich...
W statystykach górna i dolna granica reprezentują wartości progowe dla górnych i dolnych wartości odstających w zbiorze danych. Oblicza się je w następujący sposób: Dolne zamknięcie = Q1 – (1,5*IQR) Górne zamknięcie = Q3 + (1,5*IQR) gdzie IQR oznacza „rozstęp międzykwartylowy”,...
Jeśli _ _ _ _ _ µ = np σ = √ np(1-p) Okazuje się, że jeśli n jest wystarczająco duże, to możemy zastosować rozkład normalny do przybliżenia prawdopodobieństw związanych z rozkładem dwumianowym. Nazywa się to normalnym przybliżeniem dwumianowym . Aby...
Funkcja Which() w R zwraca pozycję elementów wektora logicznego, które mają wartość PRAWDA . W tym samouczku znajdziesz kilka przykładów praktycznego wykorzystania tej funkcji. Przykład 1: Znajdź elementy w wektorze Poniższy kod pokazuje, jak znaleźć położenie wszystkich elementów wektora równego 5:...
Najłatwiejszym sposobem sortowania ramki danych według kolumn w R jest użycie funkcji Order() : #sort ascending df[ order (df$var1), ] #sort descending df[ order (-df$var1), ] W tym samouczku przedstawiono kilka przykładów praktycznego wykorzystania tej funkcji z następującą ramką danych: #create...
Prosta linia regresji liniowej reprezentuje linię, która najlepiej „pasuje” do zbioru danych. W tym samouczku przedstawiono krok po kroku przykład szybkiego dodawania prostej linii regresji liniowej do wykresu rozrzutu w programie Excel. Krok 1: Utwórz dane Najpierw utwórzmy prosty zbiór danych...
Możemy użyć funkcji Aggregate() w języku R do tworzenia statystyk podsumowujących dla jednej lub większej liczby zmiennych w ramce danych. Ta funkcja wykorzystuje następującą podstawową składnię: agregat (sum_var ~ group_var, dane = df, FUN = średnia) Złoto: sum_var: Zmienna do podsumowania...
Korelacja i regresja to dwa powiązane, ale nie całkowicie takie same terminy statystyczne. W tym samouczku przedstawimy krótkie wyjaśnienie obu terminów i wyjaśnimy, w jaki sposób są one podobne i różne. Co to jest korelacja? Korelacja mierzy liniowe powiązanie między dwiema...
Zbiór zdarzeń jest łącznie wyczerpujący, jeżeli oczekuje się , że nastąpi co najmniej jedno ze zdarzeń. Na przykład, jeśli rzucimy kostką, musi ona wypaść na jednej z następujących wartości: 1 2 3 4 5 6 Zatem powiedzielibyśmy, że zbiór zdarzeń {1,...