Często możesz chcieć filtrować wiersze w ramce danych w R, które zawierają określony ciąg. Na szczęście można to łatwo zrobić, używając funkcji filter() w pakiecie dplyr i funkcji grepl() w Base R. W tym samouczku przedstawiono kilka przykładów praktycznego wykorzystania tych...
Dwie funkcje, które ludzie często mylą w R, to grep() i grepl() . Obie funkcje pozwalają sprawdzić, czy w ciągu znaków istnieje określony wzorzec, ale zwracają różne wyniki: grepl() zwraca wartość PRAWDA, jeśli w ciągu znaków istnieje wzorzec. grep() zwraca wektor...
Tibble to ramka danych w języku R, która ma udoskonaloną metodę drukowania, która wyświetla tylko pierwsze 10 linii ramki danych. To znacznie ułatwia pracę z dużymi danymi i uniemożliwia R próbowanie wyświetlenia każdego wiersza w ramce danych. Rozważmy na przykład następujący...
Często możesz chcieć obliczyć względne częstotliwości/proporcje wartości w jednej lub większej liczbie kolumn ramki danych w R. Na szczęście można to łatwo zrobić, korzystając z funkcji pakietu dplyr . W tym samouczku pokazano, jak używać tych funkcji do obliczania częstotliwości względnych...
Często możesz chcieć znaleźć maksymalną wartość każdej grupy w ramce danych w R. Na szczęście można to łatwo zrobić, korzystając z funkcji pakietu dplyr . W tym samouczku wyjaśniono, jak to zrobić, korzystając z następującej ramki danych: #create data frame df...
Często możesz chcieć utworzyć nową zmienną w ramce danych w R w oparciu o pewne warunki. Na szczęście można to łatwo zrobić, korzystając z funkcji mutate() i case_when() z pakietu dplyr . W tym samouczku przedstawiono kilka przykładów użycia tych funkcji...
Rozstęp międzykwartylowy , często nazywany „IQR”, to sposób pomiaru rozkładu środkowych 50% zbioru danych. Oblicza się go jako różnicę między pierwszym kwartylem* (25. percentyl) a trzecim kwartylem (75. percentyl) zbioru danych. Na szczęście w Pythonie łatwo jest obliczyć rozstęp międzykwartylowy zbioru...
Często możesz chcieć utworzyć dwa wykresy obok siebie, korzystając z pakietu ggplot2 w R. Na szczęście można to łatwo zrobić za pomocą pakietu patchwork . #install ggplot2 and patchwork packages install.packages(' ggplot2 ') install.packages(' patchwork ') #load the packages library(ggplot2) library(patchwork)...
Często możesz chcieć ustawić ograniczenia osi na wykresie za pomocą ggplot2 . Można to łatwo zrobić za pomocą następujących funkcji: xlim() : Określa dolną i górną granicę osi x. ylim(): określa dolną i górną granicę osi Y. Należy pamiętać, że obie...
Czasami możesz chcieć usunąć wartości odstające z wykresów pudełkowych w R. W tym samouczku wyjaśniono, jak to zrobić, używając zarówno podstawowego R, jak i ggplot2 . Usuń wartości odstające z wykresów pudełkowych w bazie R Załóżmy, że mamy następujący zbiór danych:...