Możesz użyć funkcji DataFrame.std() do obliczenia odchylenia standardowego wartości w pandzie DataFrame. W praktyce do obliczenia odchylenia standardowego można zastosować następujące metody: Metoda 1: Oblicz odchylenie standardowe kolumny df [ ' column_name ' ] . std ( ) Metoda 2: Oblicz...
Praktyczna reguła , czasami nazywana regułą 68-95-99,7, stwierdza, że dla danego zbioru danych o rozkładzie normalnym: 68% wartości danych mieści się w obrębie jednego odchylenia standardowego średniej. 95% wartości danych mieści się w granicach dwóch odchyleń standardowych od średniej. 99,7% wartości...
Często używamy współczynnika korelacji Pearsona do obliczenia korelacji pomiędzy ciągłymi zmiennymi numerycznymi. Musimy jednak użyć innej metryki, aby obliczyć korelację między zmiennymi kategorycznymi, to znaczy zmiennymi, które przyjmują nazwy lub etykiety, takie jak: Stan cywilny (panny, żonaty, rozwiedziony) Status palenia (palący,...
Kodowanie typu one-hot służy do konwertowania zmiennych kategorycznych do formatu, który może być łatwo wykorzystany przez algorytmy uczenia maszynowego . Podstawową ideą kodowania one-hot jest utworzenie nowych zmiennych, które przyjmują wartości 0 i 1 w celu reprezentowania oryginalnych wartości kategorycznych. Na...
Do tworzenia wątków pobocznych w bibliotece wizualizacji danych Seaborn w Pythonie można użyć następującej podstawowej składni: #define dimensions of subplots (rows, columns) fig, axes = plt. subplots (2, 2) #create chart in each subplot sns. boxplot (data=df, x=' team ', y='...
Aby wyodrębnić miesiąc z daty w pandach, możesz użyć następującej podstawowej składni: df[' month '] = pd. DatetimeIndex (df[' date_column ']). month Poniższy przykład pokazuje, jak w praktyce wykorzystać tę funkcję. Przykład: wyodrębnij miesiąc z daty w Pandach Załóżmy, że mamy...
Wiele testów statystycznych zakłada, że zbiory danych mają rozkład normalny. Jednak często tak się nie dzieje w praktyce. Jednym ze sposobów rozwiązania tego problemu jest przekształcenie rozkładu wartości w zbiorze danych za pomocą jednej z trzech transformacji: 1. Transformacja logu: przekształć...
Kodowanie typu one-hot służy do konwertowania zmiennych kategorycznych do formatu, który może być używany przez algorytmy uczenia maszynowego . Podstawową ideą kodowania one-hot jest utworzenie nowych zmiennych, które przyjmują wartości 0 i 1 w celu reprezentowania oryginalnych wartości kategorycznych. Na przykład...
Korelacja polichoryczna służy do obliczania korelacji między zmiennymi porządkowymi. Przypomnijmy, że zmienne porządkowe to zmienne, których możliwe wartości są kategoryczne i mają naturalny porządek. Oto kilka przykładów zmiennych mierzonych na skali porządkowej: Satysfakcja : Bardzo niezadowolony, niezadowolony, neutralny, zadowolony, bardzo zadowolony...
Regresja logistyczna to rodzaj modelu regresji, którego możemy użyć do zrozumienia związku między jedną lub większą liczbą zmiennych predykcyjnych azmienną odpowiedzi , gdy zmienna odpowiedzi jest binarna. Jeśli mamy tylko jedną zmienną predykcyjną i jedną zmienną odpowiedzi, możemy zastosować prostą regresję...