Do wybierania kolumn ramki danych według nazwy w R przy użyciu pakietu dplyr można użyć następujących metod: Metoda 1: Wybierz określone kolumny według nazwy df %>% select(var1, var3) Metoda 2: Wybierz zakres kolumn według nazwy df %>% select(var1:var3) Metoda 3: Wybierz...
Do filtrowania unikalnych wartości w ramce danych w R przy użyciu pakietu dplyr możesz użyć następujących metod: Metoda 1: Filtruj unikalne wartości w kolumnie df %>% distinct(var1) Metoda 2: Filtruj unikalne wartości w wielu kolumnach df %>% distinct(var1, var2) Metoda 3:...
Do filtrowania ramki danych według numeru wiersza można użyć następujących metod za pomocą funkcji plasterka w pakiecie dplyr : Metoda 1: Filtruj według określonych numerów linii df %>% slice(2, 3, 8) Spowoduje to zwrócenie wierszy o numerach 2, 3 i 8....
Możesz użyć następujących metod, aby wybrać losowe wiersze w ramce danych w R, używając funkcji z pakietu dplyr : Metoda 1: Wybierz losową liczbę wierszy df %>% sample_n( 5 ) Ta funkcja losowo wybiera 5 wierszy z ramki danych. Metoda 2:...
Analiza głównych składowych (PCA) to technika uczenia maszynowego bez nadzoru , która ma na celu znalezienie głównych składowych wyjaśniających dużą część zmienności w zbiorze danych. Aby zwizualizować wyniki PCA dla danego zbioru danych, możemy utworzyć biplot , czyli wykres przedstawiający każdą...
Funkcja rbindlist() w R może zostać użyta do utworzenia data.table z listy wielu obiektów data.table lub data.frame. Ta funkcja wykorzystuje następującą podstawową składnię: rbindlist(l, use. names ="check", fill= FALSE , idcol= NULL ) Złoto: l : Lista zawierająca obiekty data.table, data.frame...
Błąd, który możesz napotkać podczas korzystania z R, to: Error in lm.fit(x, y, offset = offset, singular.ok = singular.ok, ...): NA/NaN/Inf in 'y' Ten błąd występuje, gdy próbujesz użyć funkcji lm() w celu dopasowania modelu regresji liniowej w języku R, ale...
Do zliczania wartości innych niż NA w R można użyć następujących metod: Metoda 1: Zlicz wartości inne niż NA w całej ramce danych sum( ! is. na (df)) Metoda 2: Policz wartości inne niż NA w każdej kolumnie ramki danych colSums(...
Możesz użyć funkcji strptime i strftime w R do konwersji między obiektami znakowymi i czasowymi. Funkcja strptime konwertuje znaki na obiekty czasu i wykorzystuje następującą podstawową składnię: strptime(character_object, format=" %Y-%m-%d ") Funkcja strftime konwertuje obiekty czasu na znaki i wykorzystuje następującą...
Błąd, który możesz napotkać podczas korzystania z R, to: Aggregation function missing: defaulting to length Ten błąd występuje, gdy używasz funkcji dcast w pakiecie reshape2 do konwersji ramki danych z formatu długiego na format szeroki , ale w poszczególnych komórkach szerokiej...