Często możesz być zainteresowany podzbiorem ramki danych opartym na pewnych warunkach w R. Na szczęście można to łatwo zrobić za pomocą funkcji filter() z pakietu dplyr . library(dplyr) W tym samouczku wyjaśniono kilka przykładów praktycznego wykorzystania tej funkcji przy użyciu wbudowanego...
Często możesz chcieć usunąć jedną lub więcej kolumn z ramki danych w R. Na szczęście można to łatwo zrobić, korzystając z funkcjiselect() z pakietu dplyr . library (dplyr) W tym samouczku przedstawiono kilka przykładów praktycznego wykorzystania tej funkcji przy użyciu następującej...
Często możesz chcieć zmienić układ kolumn w ramce danych w R. Na szczęście można to łatwo zrobić za pomocą funkcjiselect() z pakietu dplyr . library (dplyr) W tym samouczku przedstawiono kilka przykładów praktycznego wykorzystania tej funkcji przy użyciu następującej ramki danych:...
Dwa najczęstsze zadania, które będziesz wykonywać podczas analizowania danych, to grupowanie i podsumowywanie danych. Na szczęście pakiet dplyr w R pozwala na szybkie grupowanie i podsumowywanie danych. Ten samouczek zawiera krótki przewodnik dotyczący rozpoczęcia pracy z dplyr. Zainstaluj i załaduj pakiet...
Często możesz być zainteresowany łączeniem wielu ramek danych w R. Na szczęście można to łatwo zrobić za pomocą funkcji left_join() z pakietu dplyr . library(dplyr) Załóżmy na przykład, że mamy następujące trzy ramki danych: #create data frame df1 <- data.frame(a =...
Dwa testy statystyczne, które uczniowie często mylą, to test F i test T. W tym samouczku wyjaśniono różnicę między tymi dwoma testami. Test F: podstawy Test F służy do sprawdzenia, czy dwie wariancje populacji są równe. Hipotezy zerowe i alternatywne testu...
Test Grubbsa służy do wykrywania obecności wartości odstających w zbiorze danych. Aby skorzystać z tego testu, zbiór danych musi mieć w przybliżeniu rozkład normalny i zawierać co najmniej 7 obserwacji. W tym samouczku wyjaśniono, jak wykonać test Grubbsa w Pythonie. Test...
Często możesz chcieć przefiltrować ramkę danych pand pod wieloma warunkami. Na szczęście można to łatwo zrobić za pomocą operacji logicznych. W tym samouczku przedstawiono kilka przykładów filtrowania następującej ramki DataFrame pand pod kilkoma warunkami: import pandas as pd #createDataFrame df =...
Korelacje kroczące to korelacje pomiędzy dwoma szeregami czasowymi w przesuwającym się oknie. Jedną z zalet tego typu korelacji jest możliwość wizualizacji korelacji między dwoma szeregami czasowymi w czasie. W tym samouczku wyjaśniono, jak obliczać i wizualizować korelacje kroczące w programie Excel....
Często możesz chcieć usunąć wiersze zawierające niektóre lub wszystkie NA (brakujące wartości) w ramce danych w R. W tym samouczku wyjaśniono, jak usunąć te linie za pomocą Basic R i pakietu Tidyr . W każdym z poniższych przykładów użyjemy następującej ramki...