Przewodnik - Statorials

Jak sprawdzić, czy kolumna istnieje w ramce danych w r

Przez Benjamin Anderson 16 lipca, 2023 Przewodnik 0 komentarzy

Możesz użyć następujących metod, aby sprawdzić, czy kolumna istnieje w ramce danych w R: Metoda 1: Sprawdź, czy w ramce danych istnieje dokładna nazwa kolumny ' this_column ' %in% names(df) Metoda 2: Sprawdź, czy w ramce danych istnieje częściowa nazwa kolumny...

[Kontynuuj czytanie...]

Jak używać ungroup() w dplyr (z przykładami)

Przez Benjamin Anderson 16 lipca, 2023 Przewodnik 0 komentarzy

Możesz użyć funkcji ungroup() w dplyr, aby rozgrupować wiersze po użyciu funkcji group_by() w celu podsumowania jednej zmiennej na grupę. Poniższy przykład pokazuje, jak w praktyce wykorzystać tę funkcję. Przykład: Jak używać ungroup() w dplyr Załóżmy, że mamy następującą ramkę danych...

[Kontynuuj czytanie...]

Jak wykreślić obiekt svm w r (z przykładem)

Przez Benjamin Anderson 16 lipca, 2023 Przewodnik 0 komentarzy

Do wykreślenia obiektu maszyny wektorów nośnych (SVM) w R można użyć następującej podstawowej składni: library (e1071) plot(svm_model, df) W tym przykładzie df jest nazwą ramki danych, a svm_model jest dopasowaniem maszyny wektorów nośnych za pomocą funkcji svm() . Poniższy przykład pokazuje,...

[Kontynuuj czytanie...]

Jak zmienić etykiety osi aspektu w ggplot2

Przez Benjamin Anderson 16 lipca, 2023 Przewodnik 0 komentarzy

Możesz użyć funkcji as_labeller() do zmiany etykiet osi aspektu w ggplot2: ggplot(df, aes(x, y)) + geom_point() + facet_wrap(.~group, strip. position = ' left ', labeller = as_labeller(c(A=' new1 ', B=' new2 ', C=' new3 ', D=' new4 '))) + ylab(NULL) +...

[Kontynuuj czytanie...]

Scikit-learn: użyj wielokolumnowego kodowania etykiet

Przez Benjamin Anderson 16 lipca, 2023 Przewodnik 0 komentarzy

W uczeniu maszynowym kodowanie etykiet to proces przekształcania wartości zmiennej kategorycznej na wartości całkowite. Na przykład poniższy zrzut ekranu pokazuje, jak przekonwertować każdą unikalną wartość zmiennej kategorialnej o nazwie Zespół na wartość całkowitą w oparciu o kolejność alfabetyczną: Aby wykonać kodowanie...

[Kontynuuj czytanie...]

Jak naprawić: dane wejściowe zawierają nan, nieskończoność lub wartość zbyt dużą dla typu dtype („float64”)

Przez Benjamin Anderson 16 lipca, 2023 Przewodnik 0 komentarzy

Częstym błędem, jaki możesz napotkać podczas używania Pythona, jest: ValueError: Input contains infinity or a value too large for dtype('float64'). Ten błąd zwykle pojawia się, gdy próbujesz użyć funkcji z modułu scikit-learn, ale DataFrame lub macierz, której używasz jako danych wejściowych,...

[Kontynuuj czytanie...]

Jak naprawić: pierwszy argument musi być iterowalny dla obiektów pand, przekazałeś obiekt typu „dataframe”;

Przez Benjamin Anderson 16 lipca, 2023 Przewodnik 0 komentarzy

Częstym błędem, jaki możesz napotkać podczas używania Pythona, jest: TypeError: first argument must be an iterable of pandas objects, you passed an object of type "DataFrame" Ten błąd zwykle występuje, gdy próbujesz użyć funkcji concat() w celu dodania dwóch ramek danych...

[Kontynuuj czytanie...]

Jak wykonać regresję ols w pythonie (z przykładem)

Przez Benjamin Anderson 16 lipca, 2023 Przewodnik 0 komentarzy

Regresja metodą najmniejszych kwadratów (OLS) to metoda, która pozwala znaleźć linię najlepiej opisującą związek między jedną lub większą liczbą zmiennych predykcyjnych azmienną odpowiedzi . Metoda ta pozwala nam znaleźć następujące równanie: ŷ = b 0 + b 1 x Złoto: ŷ...

[Kontynuuj czytanie...]

Jak grupować dane według czasu w pandach (z przykładem)

Przez Benjamin Anderson 16 lipca, 2023 Przewodnik 0 komentarzy

Możesz użyć następującej składni, aby pogrupować dane według czasu i wykonać agregację w pandach: df. groupby ([df[' time ']. dt . hour ]). dirty . sum () Ten konkretny przykład grupuje wartości według godzin w kolumnę o nazwie Godzina , a...

[Kontynuuj czytanie...]

Pandy: jak usunąć spacje z kolumn

Przez Benjamin Anderson 16 lipca, 2023 Przewodnik 0 komentarzy

Możesz użyć następujących metod, aby usunąć spacje z kolumn w ramce DataFrame pandy: Metoda 1: Usuń spacje z kolumny df[' my_column '] = df[' my_column ']. str . strip () Metoda 2: Usuń spacje ze wszystkich kolumn ciągów df = df....

[Kontynuuj czytanie...]

Kategoria: Przewodnik