Przewodnik - Statorials

Pandy: użyj groupby do obliczenia średniej i nie ignoruj nan

Przez Benjamin Anderson 12 lipca, 2023 Przewodnik 0 komentarzy

Podczas korzystania z funkcji pandas groupby() do grupowania według jednej kolumny i obliczania średniej wartości innej kolumny, pandy domyślnie ignorują wartości NaN . Jeśli zamiast tego chcesz wyświetlić NaN , jeśli w kolumnie znajdują się wartości NaN , możesz użyć następującej...

[Kontynuuj czytanie...]

Pandy: jak używać groupby() z size()

Przez Benjamin Anderson 12 lipca, 2023 Przewodnik 0 komentarzy

Możesz użyć następujących metod z funkcjami groupby() i size() w pandach, aby policzyć liczbę wystąpień na grupę: Metoda 1: zliczanie wystąpień pogrupowanych według zmiennej df. groupby (' var1 '). size () Metoda 2: Zliczanie wystąpień pogrupowanych według wielu zmiennych df. groupby...

[Kontynuuj czytanie...]

Pandy: jak grupować według zakresu wartości

Przez Benjamin Anderson 12 lipca, 2023 Przewodnik 0 komentarzy

Możesz użyć poniższej składni, aby użyć funkcji groupby() w pandach, aby pogrupować kolumnę według zakresu wartości przed wykonaniem agregacji: df. groupby (pd. cut (df[' my_column '], [0, 25, 50, 75, 100])). sum () Ten konkretny przykład pogrupuje wiersze DataFrame według następującego...

[Kontynuuj czytanie...]

Jak liczyć słowa w ciągu w r (z przykładami)

Przez Benjamin Anderson 12 lipca, 2023 Przewodnik 0 komentarzy

Istnieją trzy metody, których możesz użyć do zliczenia liczby słów w ciągu w języku R: Metoda 1: Użyj podstawy R lengths(strsplit(my_string, ' ')) Metoda 2: Użyj pakietu stringi library (stringi) stri_count_words(my_string) Metoda 3: Użyj pakietu stringr library (stringr) str_count(my_string, ' \\w+...

[Kontynuuj czytanie...]

O: jak używać strsplit() z wieloma ogranicznikami

Przez Benjamin Anderson 12 lipca, 2023 Przewodnik 0 komentarzy

Możesz użyć następującej podstawowej składni z funkcją strsplit() w R, aby podzielić ciąg na części w oparciu o wiele ograniczników: strsplit(my_string, ' [,& ]+ ') Ten konkretny przykład dzieli ciąg o nazwie mój_ciąg za każdym razem, gdy napotka jeden z następujących...

[Kontynuuj czytanie...]

Odp.: jak znaleźć unikalne wartości i je posortować

Przez Benjamin Anderson 12 lipca, 2023 Przewodnik 0 komentarzy

Możesz użyć następujących metod, aby znaleźć unikalne wartości, a następnie posortować je w R: Metoda 1: Znajdź unikalne wartości w wektorze i posortuj je #get unique values sorted in ascending order sort(unique(data)) Metoda 2: Znajdź unikalne wiersze w ramce danych i...

[Kontynuuj czytanie...]

Pandy: jak używać funkcji opisu () i usuwać notację naukową

Przez Benjamin Anderson 12 lipca, 2023 Przewodnik 0 komentarzy

Możesz użyć funkcji opisu() do wygenerowaniastatystyk opisowych dla zmiennych w ramce DataFrame pandy. Aby usunąć notację naukową z wyników funkcji opisu() , możesz skorzystać z następujących metod: Metoda 1: Usuń notację naukową, jeśli używasz funkcji opisu() z kolumną df[' my_column ']....

[Kontynuuj czytanie...]

Pandy: jak używać funkcji opisu() z określonymi percentylami

Przez Benjamin Anderson 12 lipca, 2023 Przewodnik 0 komentarzy

Możesz użyć funkcji opisu() do wygenerowaniastatystyk opisowych dla zmiennych w ramce DataFrame pandy. Domyślnie pandy obliczają 25., 50. i 75. percentyl dla zmiennych. Można jednak użyć argumentu percentyle w funkcji opisu() , aby określić dokładne percentyle do obliczenia. Poniższe przykłady pokazują,...

[Kontynuuj czytanie...]

Pandy: jak używać funkcji opisu() tylko dla wartości średnia i standardowa

Przez Benjamin Anderson 12 lipca, 2023 Przewodnik 0 komentarzy

Możesz użyć funkcji opisu() do wygenerowaniastatystyk opisowych dla zmiennych w ramce DataFrame pandy. Domyślnie funkcja opisu() oblicza następujące metryki dla każdej zmiennej numerycznej w ramce DataFrame: liczba (liczba wartości) średnia (wartość średnia) std (odchylenie standardowe) min (wartość minimalna) 25% (25. percentyl)...

[Kontynuuj czytanie...]

Pandy: jak używać funkcji opisu () dla zmiennych kategorycznych

Przez Benjamin Anderson 12 lipca, 2023 Przewodnik 0 komentarzy

Domyślnie funkcja opisu() w pandach oblicza statystyki opisowe dla wszystkich zmiennych numerycznych w ramce DataFrame. Można jednak również użyć następujących metod do obliczenia statystyk opisowych dla zmiennych kategorycznych : Metoda 1: Oblicz statystyki opisowe dla zmiennych kategorycznych df. describe (include=' object...

[Kontynuuj czytanie...]

Kategoria: Przewodnik