Tabela częstości to tabela, która wyświetla częstotliwości różnych kategorii. Ten typ tabeli jest szczególnie przydatny do zrozumienia rozkładu wartości w zbiorze danych. W tym samouczku wyjaśniono, jak tworzyć tabele częstości w języku R przy użyciu następującej ramki danych: #make this example...
Zagnieżdżona pętla for umożliwia iterację po elementach w wielu wektorach (lub wielu wymiarach macierzy) i wykonywanie określonych operacji. Podstawowa struktura pętli for w R to: for (i in 1:4) { print (i) } [1] 1 [1] 2 [1] 3 [1] 4...
Często możesz chcieć przekonwertować skalę osi x lub y wykresu ggplot2 na skalę logarytmiczną. Aby to zrobić, możesz użyć jednej z dwóch metod, używając tylko ggplot2: 1. Użyj skali_y_ciągłej() lub skali_x_ciągłej() ggplot(df, aes (x=x, y=y)) + geom_point() + scale_y_continuous(trans=' log10 ')...
Zakres to różnica między największą i najmniejszą wartością w zbiorze danych. Aby znaleźć zakres zbioru danych w R, możemy użyć następującej składni: data <- c(1, 3, NA, 5, 16, 18, 22, 25, 29) #calculate range max(data, na. rm = TRUE )...
Aby wybrać losową próbkę w R, możemy użyć funkcji sample() , która wykorzystuje następującą składnię: próbka(x, rozmiar, zamień=FAŁSZ, prawdopodobieństwo=NULL) Złoto: x: wektor elementów do wyboru. rozmiar: wielkość próbki. zamień: czy pobierać próbkę z wymianą, czy nie. Wartość domyślna to fałsz. prob:...
Możesz szybko wygenerować rozkład normalny w R za pomocą funkcji rnorm() , która wykorzystuje następującą składnię: rnorm(n, mean=0, sd=1) Złoto: n: Liczba obserwacji. średnia: średnia rozkładu normalnego. Wartość domyślna to 0. sd: odchylenie standardowe rozkładu normalnego. Wartość domyślna to 1. W...
Operator %in% w R pozwala określić, czy element należy do wektora lub ramki danych. W tym samouczku przedstawiono trzy przykłady użycia tej funkcji w różnych scenariuszach. Przykład 1: Używanie %in% z wektorami Możemy użyć operatora %in% , aby określić, ile elementów...
Możesz wykreślić gładką linię w ggplot2 za pomocą funkcji geom_smooth() , która wykorzystuje następującą podstawową składnię: ggplot(df, aes (x=x, y=y)) + geom_smooth() W tym samouczku przedstawiono kilka przykładów praktycznego wykorzystania tej funkcji. Przykład: tworzenie gładkich linii w ggplot2 Załóżmy, że mamy...
Funkcja xtabs() w R pozwala szybko obliczyć częstości jednej lub większej liczby zmiennych. Używa następującej podstawowej składni: xtabs(~nazwa_zmiennej, dane=dane) Złoto: nazwa_zmiennej: Zmienna, dla której chcesz obliczyć częstotliwości. dane: Nazwa bloku danych, z którego pochodzi zmienna. W tym samouczku przedstawiono kilka przykładów...
Współczynnik determinacji (powszechnie oznaczany jako R 2 ) to proporcja wariancji zmiennej odpowiedzi , którą można wyjaśnić za pomocą zmiennych objaśniających w modelu regresji. W tym samouczku przedstawiono przykład znajdowania i interpretowania R2 w modelu regresji w języku R. Powiązane: Jaka...