Przewodnik - Statorials

Jak obliczyć odchylenie standardowe w pandach: z przykładami

Przez Benjamin Anderson 23 lipca, 2023 Przewodnik 0 komentarzy

Możesz użyć funkcji DataFrame.std() do obliczenia odchylenia standardowego wartości w pandzie DataFrame. W praktyce do obliczenia odchylenia standardowego można zastosować następujące metody: Metoda 1: Oblicz odchylenie standardowe kolumny df [ ' column_name ' ] . std ( ) Metoda 2: Oblicz...

[Kontynuuj czytanie...]

Jak zastosować praktyczną zasadę w r

Przez Benjamin Anderson 23 lipca, 2023 Przewodnik 0 komentarzy

Praktyczna reguła , czasami nazywana regułą 68-95-99,7, stwierdza, że dla danego zbioru danych o rozkładzie normalnym: 68% wartości danych mieści się w obrębie jednego odchylenia standardowego średniej. 95% wartości danych mieści się w granicach dwóch odchyleń standardowych od średniej. 99,7% wartości...

[Kontynuuj czytanie...]

Jak obliczyć korelację pomiędzy zmiennymi kategorycznymi

Przez Benjamin Anderson 23 lipca, 2023 Przewodnik 0 komentarzy

Często używamy współczynnika korelacji Pearsona do obliczenia korelacji pomiędzy ciągłymi zmiennymi numerycznymi. Musimy jednak użyć innej metryki, aby obliczyć korelację między zmiennymi kategorycznymi, to znaczy zmiennymi, które przyjmują nazwy lub etykiety, takie jak: Stan cywilny (panny, żonaty, rozwiedziony) Status palenia (palący,...

[Kontynuuj czytanie...]

Jak wykonać kodowanie one-hot w pythonie

Przez Benjamin Anderson 23 lipca, 2023 Przewodnik 0 komentarzy

Kodowanie typu one-hot służy do konwertowania zmiennych kategorycznych do formatu, który może być łatwo wykorzystany przez algorytmy uczenia maszynowego . Podstawową ideą kodowania one-hot jest utworzenie nowych zmiennych, które przyjmują wartości 0 i 1 w celu reprezentowania oryginalnych wartości kategorycznych. Na...

[Kontynuuj czytanie...]

Jak tworzyć wątki poboczne w seaborn (z przykładami)

Przez Benjamin Anderson 23 lipca, 2023 Przewodnik 0 komentarzy

Do tworzenia wątków pobocznych w bibliotece wizualizacji danych Seaborn w Pythonie można użyć następującej podstawowej składni: #define dimensions of subplots (rows, columns) fig, axes = plt. subplots (2, 2) #create chart in each subplot sns. boxplot (data=df, x=' team ', y='...

[Kontynuuj czytanie...]

Jak wyodrębnić miesiąc z daty w pandach (z przykładami)

Przez Benjamin Anderson 23 lipca, 2023 Przewodnik 0 komentarzy

Aby wyodrębnić miesiąc z daty w pandach, możesz użyć następującej podstawowej składni: df[' month '] = pd. DatetimeIndex (df[' date_column ']). month Poniższy przykład pokazuje, jak w praktyce wykorzystać tę funkcję. Przykład: wyodrębnij miesiąc z daty w Pandach Załóżmy, że mamy...

[Kontynuuj czytanie...]

Jak przekształcać dane w pythonie (log, pierwiastek kwadratowy, pierwiastek sześcienny)

Przez Benjamin Anderson 23 lipca, 2023 Przewodnik 0 komentarzy

Wiele testów statystycznych zakłada, że zbiory danych mają rozkład normalny. Jednak często tak się nie dzieje w praktyce. Jednym ze sposobów rozwiązania tego problemu jest przekształcenie rozkładu wartości w zbiorze danych za pomocą jednej z trzech transformacji: 1. Transformacja logu: przekształć...

[Kontynuuj czytanie...]

Jak wykonać kodowanie one-hot w r

Przez Benjamin Anderson 23 lipca, 2023 Przewodnik 0 komentarzy

Kodowanie typu one-hot służy do konwertowania zmiennych kategorycznych do formatu, który może być używany przez algorytmy uczenia maszynowego . Podstawową ideą kodowania one-hot jest utworzenie nowych zmiennych, które przyjmują wartości 0 i 1 w celu reprezentowania oryginalnych wartości kategorycznych. Na przykład...

[Kontynuuj czytanie...]

Jak obliczyć korelację polichoryczną w r

Przez Benjamin Anderson 23 lipca, 2023 Przewodnik 0 komentarzy

Korelacja polichoryczna służy do obliczania korelacji między zmiennymi porządkowymi. Przypomnijmy, że zmienne porządkowe to zmienne, których możliwe wartości są kategoryczne i mają naturalny porządek. Oto kilka przykładów zmiennych mierzonych na skali porządkowej: Satysfakcja : Bardzo niezadowolony, niezadowolony, neutralny, zadowolony, bardzo zadowolony...

[Kontynuuj czytanie...]

Zrozumienie hipotezy zerowej dla regresji logistycznej

Przez Benjamin Anderson 23 lipca, 2023 Przewodnik 0 komentarzy

Regresja logistyczna to rodzaj modelu regresji, którego możemy użyć do zrozumienia związku między jedną lub większą liczbą zmiennych predykcyjnych azmienną odpowiedzi , gdy zmienna odpowiedzi jest binarna. Jeśli mamy tylko jedną zmienną predykcyjną i jedną zmienną odpowiedzi, możemy zastosować prostą regresję...

[Kontynuuj czytanie...]

Kategoria: Przewodnik