Rozstęp międzykwartylowy reprezentuje różnicę między pierwszym kwartylem (25. percentyl) a trzecim kwartylem (75. percentyl) zbioru danych. W uproszczeniu mierzy odchylenie pomiędzy środkowymi 50% wartości. IQR = Q3 – Q1 Możemy wykorzystać wbudowaną funkcję IQR() do obliczenia rozstępu międzykwartylowego zbioru wartości w...
N-ty percentyl zbioru danych to wartość, która odcina górne n procent wartości danych, gdy wszystkie wartości są posortowane od najmniejszej do największej. Na przykład 90. percentyl zbioru danych to wartość oddzielająca dolne 90% wartości danych od górnych 10% wartości danych. Istnieją...
Możesz łatwo wykreślić wiele linii na tym samym wykresie w programie Excel, po prostu podświetlając wiele wierszy (lub kolumn) i tworząc wykres liniowy. Poniższe przykłady pokazują, jak narysować wiele linii na wykresie w programie Excel przy użyciu różnych formatów. Przykład 1:...
Metoda najmniejszych kwadratów to metoda, za pomocą której możemy znaleźć linię regresji, która najlepiej pasuje do danego zestawu danych. Aby zastosować metodę najmniejszych kwadratów do dopasowania linii regresji w programie Excel, możemy użyć funkcji =LINEST() . Poniższy przykład krok po kroku...
Możesz użyć funkcji merge() , aby wykonać lewe złączenie w bazie R: #left join using base R merge(df1,df2, all. x = TRUE ) Możesz także użyć funkcji left_join() z pakietu dplyr , aby wykonać lewe połączenie: #left join using dplyr dplyr::left_join(df2,...
Aby napisać pętlę for z zakresem w R, możesz użyć następującej podstawowej składni: for (i in 1:10) { do something } Poniższe przykłady pokazują, jak używać tej składni w praktyce. Przykład 1: Wydrukuj wartości w zakresie Poniższy kod pokazuje, jak użyć...
Aby narysować linię trendu na wykresie w ggplot2, możesz użyć następującej podstawowej składni: ggplot(df, aes(x=xvar, y=yvar)) + geom_point() + geom_smooth(method=lm) #add linear trend line Poniższe przykłady pokazują, jak zastosować tę składnię w praktyce z następującą ramką danych: #create data frame df...
Możesz użyć funkcji nrow() w R, aby policzyć liczbę wierszy w ramce danych: #count number of rows in data frame nrow(df) Poniższe przykłady pokazują, jak w praktyce wykorzystać tę funkcję z następującą ramką danych: #create data frame df <- data. frame...
Funkcji gsub() w R można użyć do zastąpienia wszystkich wystąpień określonego tekstu w ciągu w R. Ta funkcja wykorzystuje następującą podstawową składnię: gsub(pattern, replacement, x) Złoto: wzór : wzór, którego należy szukać zastąpienie : Zastąpienie wzoru x : Ciąg do wyszukania...
Mediana reprezentuje środkową wartość zbioru danych, gdy wszystkie wartości są uporządkowane od najmniejszej do największej. Na przykład mediana w następującym zbiorze danych wynosi 19: Zbiór danych: 3, 4, 11, 15, 19 , 22, 23, 23, 26 Mediana reprezentuje również 50. percentyl...