Możesz użyć następującej funkcji niestandardowej, aby zamienić położenie dwóch kolumn w ramce DataFrame pandy: def swap_columns (df, col1, col2): col_list = list ( df.columns ) x, y = col_list. index (col1), col_list. index (col2) col_list[y], col_list[x] = col_list[x], col_list[y] df =...
R-kwadrat , często zapisywany jako R2 , to proporcja wariancji zmiennej odpowiedzi , którą można wyjaśnić za pomocą zmiennych predykcyjnych w modelu regresji liniowej . Wartość R do kwadratu może zmieniać się od 0 do 1, gdzie: Wartość 0 wskazuje, że...
Błąd, który możesz napotkać podczas korzystania z Pythona, to: TypeError : unsupported operand type(s) for -: 'str' and 'int' Ten błąd występuje podczas próby odejmowania ze zmienną łańcuchową i zmienną numeryczną. Poniższy przykład pokazuje, jak w praktyce rozwiązać ten błąd. Jak...
Kiedy dopasowujemy modele regresji liniowej, często obliczamy wartość R-kwadrat modelu. Wartość R-kwadrat to proporcja wariancji zmiennej odpowiedzi , którą można wyjaśnić za pomocą zmiennych predykcyjnych w modelu. Wartość R do kwadratu może zmieniać się od 0 do 1, gdzie: Wartość 0...
Histogram zapewnia użyteczny sposób wizualizacji rozkładu wartości w zbiorze danych. Oś x histogramu przedstawia grupy wartości danych, a oś y informuje nas, ile obserwacji w zbiorze danych znajduje się w każdej grupie. Ponieważ histogram umieszcza obserwacje w pojemnikach, nie jest możliwe...
W uczeniu maszynowym współczynnik błędnych klasyfikacji to metryka, która informuje nas o odsetku obserwacji, które zostały błędnie przewidziane przez model klasyfikacyjny . Oblicza się go w następujący sposób: Wskaźnik błędnych klasyfikacji = # niepoprawnych przewidywań / # wszystkich przewidywań Wartość współczynnika...
Hipoteza testowa służy do sprawdzenia, czy hipoteza dotycząca parametru populacji jest prawdziwa. Ilekroć przeprowadzamy test hipotezy, zawsze definiujemy hipotezę zerową i alternatywną: Hipoteza zerowa (H 0 ): Przykładowe dane pochodzą wyłącznie z przypadku. Hipoteza alternatywna ( HA ): na przykładowe dane...
Jednym z najczęstszych sposobów oceny wydajności modelu klasyfikacyjnego jest utworzenie macierzy zamieszania, która podsumowuje przewidywane wyniki modelu w porównaniu z rzeczywistymi wynikami zbioru danych. Dwie metryki, które często interesują nas w macierzy zamieszania, to dodatnia wartość predykcyjna i czułość . Dodatnia...
Błąd, który możesz napotkać w R to: Error in .Call.graphics(C_palette2, .Call(C_palette2, NULL)): invalid graphics state Ten błąd może wystąpić z trzech powodów: 1. Podczas tej samej sesji tworzysz wykresy w bazie R i ggplot2. 2. Twoja wersja ggplot2 nie jest kompatybilna...
Funkcja readLines() w R może zostać użyta do odczytania całości lub części wierszy tekstu z obiektu połączenia. Ta funkcja używa następującej składni: readLines(con, n=-1L) Złoto: wada: obiekt połączenia lub ciąg znaków n: Maksymalna liczba wierszy do odczytania. Domyślnie czytane są wszystkie...