Dokładny test Fishera służy do określenia, czy istnieje istotny związek między dwiema zmiennymi kategorycznymi. Jest powszechnie stosowany jako alternatywa dla testu niezależności chi-kwadrat, gdy liczba co najmniej jednej komórki w tabeli 2 × 2 jest mniejsza niż 5. Podając dokładne wyniki...
Aby zmienić odstępy między osiami na podstawowym wykresie R, można użyć następującej podstawowej składni: #create plot with no axis intervals plot(x, y, xaxt=' n ', yaxt=' n ') #specifty x-axis interval axis(side= 1 , at=c(1, 5, 10, 15)) #specify y-axis interval...
Możesz użyć argumentu motywu() w ggplot2, aby zmodyfikować obszary marginesów wykresu: ggplot(df, aes(x=x)) + geom_histogram() + theme(plot. margin =unit(c(5,1,1,1), ' cm ')) Należy pamiętać, że kolejność marginesów działki jest następująca: jednostka(c(góra, prawo, dół, lewo), jednostki) Poniższe przykłady pokazują, jak w praktyce...
Aby szybko znaleźć dzień tygodnia, możesz użyć następujących funkcji z pakietu lubridate w R: Metoda 1: Znajdź numeryczny dzień tygodnia (zakładając, że tydzień zaczyna się w niedzielę) wday(df$date_column) Metoda 2: Znajdź numeryczny dzień tygodnia (zakładając, że tydzień zaczyna się w poniedziałek)...
Wiele testów statystycznych zakłada , że zbiory danych mają rozkład normalny. Istnieją cztery typowe sposoby sprawdzenia tego założenia w R: 1. (Metoda wizualna) Utwórz histogram. Jeżeli histogram ma w przybliżeniu kształt dzwonu, zakłada się, że dane mają rozkład normalny. 2. (Metoda...
V Cramera jest miarą siły związku między dwiema zmiennymi nominalnymi. Przechodzi od 0 do 1, gdzie: Wartość 0 oznacza brak związku między dwiema zmiennymi. 1 wskazuje na doskonałe powiązanie pomiędzy obiema zmiennymi. Oblicza się go w następujący sposób: V Cramera =...
Błąd standardowy nachylenia regresji jest sposobem pomiaru „niepewności” w szacowaniu nachylenia regresji. Oblicza się go w następujący sposób: Złoto: n : całkowity rozmiar próbki y i : rzeczywista wartość zmiennej odpowiedzi ŷ i : przewidywana wartość zmiennej odpowiedzi x i :...
Modele regresji służą do ilościowego określenia związku między jedną lub większą liczbą zmiennych predykcyjnych azmienną odpowiedzi . Ilekroć dopasowujemy model regresji, chcemy zrozumieć, jak dobrze model jest w stanie wykorzystać wartości zmiennych predykcyjnych do przewidzenia wartości zmiennej odpowiedzi. Dwie metryki, których...
Istnieją dwa typowe scenariusze, w których sensowne jest użycie skali logarytmicznej podczas tworzenia wykresów: Scenariusz 1: Kilka wartości jest znacznie wyższych niż wszystkie inne wartości. Stosując skalę logarytmiczną łatwiej jest zwizualizować na wykresie mniejsze wartości. Scenariusz 2: Chcesz analizować zmianę procentową,...
Wykres półlogarytmiczny to rodzaj wykresu, w którym zastosowano skalę liniową na osi x i skalę logarytmiczną na osi y. Często korzystamy z tego typu wykresu, gdy wartości zmiennej y charakteryzują się znacznie większą zmiennością niż wartości zmiennej x. Ten typ wykresu...