Dziedzina statystyki zajmuje się gromadzeniem, analizą, interpretacją i prezentacją danych. W dziedzinie rachunkowości statystyki są ważne z następujących powodów: Powód 1 : Księgowi używają statystyk opisowych do podsumowywania danych związanych z przychodami, wydatkami i zyskami firmy. Powód 2 : Księgowi używają...
Ranga percentylowa wartości mówi nam, jaki procent wartości w zbiorze danych ma rangę równą lub niższą od danej wartości. Do obliczenia rangi percentylowej u pand możesz użyć następujących metod: Metoda 1: Oblicz rangę percentyla dla kolumny df[' percent_rank '] = df['...
Możesz użyć funkcji opisu() do wygenerowania statystyk opisowych dla zmiennych w ramce DataFrame pandy. Aby używać funkcji opisu() z funkcją groupby() w pandach, możesz użyć następującej podstawowej składni: df. groupby (' group_var ')[' values_var ']. describe () Poniższy przykład pokazuje, jak...
Możesz użyć modułu xarray , aby szybko utworzyć ramkę DataFrame 3D pandy. W tym samouczku wyjaśniono, jak utworzyć następującą ramkę danych 3D pandy przy użyciu funkcji modułu xarray: product_A product_B product_C year quarter 2021 Q1 1.624345 0.319039 50 Q2 -0.611756 0.319039...
Najłatwiejszym sposobem znalezienia prawdopodobieństwa na podstawie wyniku az jest po prostu znalezienie prawdopodobieństwa odpowiadającego wynikowi z w tabeli z. W tym samouczku wyjaśniono, jak korzystać z tabeli z w celu znalezienia następujących prawdopodobieństw: Prawdopodobieństwo, że wartość jest poniżej pewnego wyniku Z....
Średnia reprezentuje średnią wartość w zestawie danych. Oblicza się go w następujący sposób: Średnia próbki = Σx i / n Złoto: Σ: Symbol oznaczający „sumę” x i : i -ta obserwacja w zbiorze danych n: całkowita liczba obserwacji w zbiorze danych...
Jednym z najpopularniejszych algorytmów grupowania w uczeniu maszynowym jest grupowanie k-średnich . Grupowanie K-średnich to technika, w której każdą obserwację ze zbioru danych umieszczamy w jednym z K klastrów. Ostatecznym celem jest utworzenie K klastrów, w których obserwacje w każdym klastrze...
Możesz użyć następujących metod, aby użyć LIKE (podobnie do SQL) w funkcji query() pandy w celu znalezienia wierszy zawierających określony wzorzec: Metoda 1: Znajdź wiersze zawierające wzór df. query (' my_column.str.contains("pattern1") ') Metoda 2: Znajdź wiersze zawierające jeden z wielu wzorców...
Możesz użyć następujących metod, aby wykreślić rozkład wartości kolumn w pandzie DataFrame: Metoda 1: Wykreśl rozkład wartości w kolumnie df[' my_column ']. plot (kind=' kde ') Metoda 2: Wykreśl rozkład wartości w jednej kolumnie, pogrupowanych według innej kolumny df. groupby ('...