Dwa terminy, które uczniowie często mylą w statystyce, to błąd standardowy i margines błędu . Błąd standardowy mierzy precyzję oszacowania średniej populacji. Oblicza się go w następujący sposób: Błąd standardowy = s / √n Złoto: s: odchylenie standardowe próbki n: wielkość...
Wykres par to macierz wykresów rozrzutu, która pozwala zrozumieć relację parami pomiędzy różnymi zmiennymi w zbiorze danych. Na szczęście łatwo jest utworzyć wykres par w R za pomocą funkcji pairs() . W tym samouczku przedstawiono kilka przykładów praktycznego wykorzystania tej funkcji....
Rozkład dwumianowy opisuje prawdopodobieństwo uzyskania k sukcesów w n eksperymentach dwumianowych. Jeśli zmienna losowa X ma rozkład dwumianowy, prawdopodobieństwo, że X = k powodzenia można obliczyć za pomocą następującego wzoru: P(X=k) = n C k * p k * (1-p) nk...
Zmienna towarzysząca (czasami nazywana „zmienną towarzyszącą”) to zmienna, która nie jest głównym przedmiotem zainteresowania w badaniu, ale która mimo to może wchodzić w interakcję z badanymi zmiennymi będącymi przedmiotem zainteresowania. Nieuwzględnienie tego typu zmiennych może prowadzić do stronniczych lub mylących wyników...
Częstotliwość względna mierzy, jak często dana wartość pojawia się w zbiorze danych w stosunku do całkowitej liczby wartości w zbiorze danych. Aby obliczyć częstotliwości względne, możesz użyć następującej funkcji w Pythonie: def rel_freq (x): freqs = [(value, x.count(value) / len(x)) for...
Przedział ufności to zakres wartości, który prawdopodobnie będzie zawierał parametr populacji z pewnym poziomem ufności. W tym samouczku wyjaśniono, jak wykreślić przedział ufności dla zbioru danych w języku R. Przykład: wykreślenie przedziału ufności w R Załóżmy, że mamy następujący zbiór danych...
Często podczas wykonywania prostej regresji liniowej możesz chcieć utworzyć wykres rozrzutu, aby zwizualizować różne kombinacje wartości x i y, a także szacowaną linię regresji. Na szczęście istnieją dwa proste sposoby tworzenia tego typu fabuły w Pythonie. W tym samouczku wyjaśniono obie...
Wykres łodyg i liści to wykres przedstawiający dane poprzez podzielenie każdej wartości w zestawie danych na łodygę i liść . Jest to wyjątkowy wykres, ponieważ pomaga nam zwizualizować kształt rozkładu, jednocześnie wyświetlając surowe wartości poszczególnych danych. W tym samouczku wyjaśniono, jak...
Często możesz chcieć ułożyć wiersze ramki danych w R w określonej kolejności. Na szczęście można to łatwo zrobić, korzystając z funkcji aranżacji() z biblioteki dplyr . W tym samouczku wyjaśniono kilka przykładów praktycznego wykorzystania tej funkcji przy użyciu następującej ramki danych:...
Często możesz być zainteresowany policzeniem liczby obserwacji na grupę w R. Na szczęście można to łatwo zrobić, korzystając z funkcji count() biblioteki dplyr . W tym samouczku wyjaśniono kilka przykładów praktycznego wykorzystania tej funkcji przy użyciu następującej ramki danych: #create data...