Możesz użyć następującej podstawowej składni, aby wyświetlić listę plików w bieżącym katalogu roboczym w R według daty: #extract all CSV files in working directory file_info = file. info ( list.files (pattern=" *.csv ")) #sort files based on mtime (date and time...
Możesz użyć funkcji Rank() w bazie R, aby zwrócić rangę wartości w wektorze. Ta funkcja wykorzystuje następującą podstawową składnię: rank(x, na.last=TRUE,ties.method=”średnia”) Złoto: x : Wektor zawierający wartości do sklasyfikowania na.last : Jeśli TRUE, brakujące wartości są umieszczane na końcu. Jeśli FALSE,...
Test Walda można zastosować do sprawdzenia, czy jeden lub więcej parametrów modelu ma określone wartości. Test ten jest często używany do określenia, czy jedna lub więcej zmiennych predykcyjnych w modelu regresji jest równych zero. W tym teście używamy następujących hipotez zerowych...
Najłatwiejszym sposobem utworzenia obiektu szeregów czasowych w R jest użycie funkcji ts() . Ta funkcja wykorzystuje następującą podstawową składnię: ts(dane, początek, koniec, częstotliwość) Złoto: dane : wektor lub macierz wartości szeregów czasowych start : Czas pierwszej obserwacji end : Czas ostatniej...
Aby ocenić, jak dobrze model jest w stanie dopasować się do zbioru danych, musimy przeanalizować jego działanie na podstawie obserwacji, których nigdy wcześniej nie widział. Jednym z najczęstszych sposobów osiągnięcia tego jest użycie k-krotnej walidacji krzyżowej , która wykorzystuje następujące podejście:...
Kryterium informacyjne Akaike ( AIC ) to metryka używana do ilościowego określenia, jak dobrze model pasuje do zbioru danych. Oblicza się go w następujący sposób: AIC = 2K – 2 ln (L) Złoto: K: Liczba parametrów modelu. Domyślna wartość K wynosi...
Możesz użyć następującej podstawowej składni w dplyr, aby wykonać lewe złączenie dwóch ramek danych, używając tylko wybranych kolumn: library (dplyr) final_df <- df_A %>% left_join(select(df_B, team, conference), by=" team ") W tym konkretnym przykładzie zostanie wykonane lewe złączenie ramek danych o...
Możesz użyć następującej podstawowej składni w dplyr, aby połączyć dwie ramki danych, gdy łączone kolumny mają różne nazwy w każdej ramce danych: library (dplyr) final_df <- left_join(df_A, df_B, by = c(' team ' = ' team_name ')) Ten konkretny przykład wykona...
Sprzężenie wewnętrzne umożliwia połączenie dwóch tabel, w których jedynymi wierszami w wynikowej tabeli są te, w których znajdują się pasujące wartości w kolumnie wspólnej dla obu tabel. Poniższy przykład pokazuje krok po kroku, jak używać funkcji Power Query w programie Excel...
Aby utworzyć funkcję JEŻELI z 5 warunkami w programie Excel, możesz użyć następujących formuł: Metoda 1: Zagnieżdżona funkcja JEŻELI =IF( C2 <15,"F",IF( C2 <20,"E",IF( C2 <25,"D",IF( C2 <30,"C",IF( C2 <35,"B" , "HAS"))))) Metoda 2: Funkcja JEŻELI z logiką AND =IF(AND( A2...