Często możesz chcieć połączyć dwie kolumny w jedną w R. Załóżmy na przykład, że masz ramkę danych z trzema kolumnami: month year value 10 2019 15 10 2020 13 11 2020 13 11 2021 19 12 2021 22 Możesz połączyć kolumny...
Często możesz chcieć iterować po nazwach kolumn ramki danych w R i wykonywać określone operacje na każdej kolumnie. Można to zrobić na dwa typowe sposoby: Metoda 1: Użyj pętli For for (i in colnames(df)){ some operation } Metoda 2: Użyj sapply()...
Często możesz chcieć porównać dwie kolumny w R i zapisać wyniki porównania w trzeciej kolumnie. Można to łatwo zrobić, korzystając z następującej składni: df$ new_col <- ifelse (df$ col1 > df$ col2 , ' A ', ifelse (df$ col1 < df$...
Często możesz chcieć obliczyć średnią z wielu kolumn w R. Na szczęście możesz to łatwo zrobić za pomocą funkcji colMeans() . colMeans(df) Poniższe przykłady pokazują, jak w praktyce wykorzystać tę funkcję. Używanie metody colMeans() do znajdowania średniej z wielu kolumn Poniższy...
Często możesz chcieć usunąć wiele kolumn jednocześnie z ramki danych w R. Najprostszym sposobem, aby to zrobić, jest użycie następującej składni: df[, c('column_name1', 'column_name2')] <- list(NULL) Na przykład poniższa składnia pokazuje, jak usunąć kolumny 2 i 3 z danej ramki danych:...
Często możesz chcieć obliczyć średnią grupy w R. Możesz w tym celu skorzystać z trzech metod: Metoda 1: Użyj zasady R. aggregate(df$col_to_aggregate, list(df$col_to_group_by), FUN= mean ) Metoda 2: Użyj pakietu dplyr(). library (dplyr) df %>% group_by (col_to_group_by) %>% summarise_at (vars(col_to_aggregate), list(name...
Biblioteka wizualizacji danych ggplot2 ułatwia tworzenie od podstaw pięknych wykresów w języku R. Jednak ggplot2 nie udostępnia tytułów wykresów, chyba że je określisz. W tym samouczku dokładnie wyjaśniono, jak dodawać i edytować tytuły na wykresach ggplot2. Jak dodać tytuł ggplot2 Poniższy...
Wykres kołowy jest rodzajem wykresu w kształcie koła i wykorzystuje wycinki do przedstawienia proporcji całości. W tym samouczku wyjaśniono, jak tworzyć i edytować wykresy kołowe w języku R przy użyciu biblioteki wizualizacji danych ggplot2 . Jak utworzyć podstawowy wykres kołowy Poniższy...
Test Shapiro-Wilka jest testem normalności. Służy do określenia, czy próbka pochodzi z rozkładu normalnego . Ten typ testu jest przydatny do ustalenia, czy dany zbiór danych pochodzi z rozkładu normalnego, co jest powszechnie stosowanym założeniem w wielu testach statystycznych, w tym...
Często możesz chcieć zastąpić brakujące wartości w kolumnach ramki danych w R średnią lub medianą tej konkretnej kolumny. Aby zastąpić brakujące wartości w jednej kolumnie, możesz użyć następującej składni: df$col[ is.na (df$col)] <- mean(df$col, na.rm = TRUE ) Aby zastąpić brakujące...