Analiza skupień to technika stosowana w uczeniu maszynowym , która próbuje znaleźć grupy obserwacji w zbiorze danych. Celem analizy skupień jest znalezienie takich skupień, w których obserwacje w obrębie każdego skupienia są do siebie dość podobne, podczas gdy obserwacje w różnych...
Odchylenie standardowe jest jednym z najczęstszych sposobów pomiaru rozkładu wartości w zbiorze danych. Okazuje się, że istnieją dwa różne typy odchyleń standardowych, które można obliczyć, w zależności od rodzaju danych, z którymi pracujesz. 1. Odchylenie standardowe populacji Odchylenie standardowe populacji należy...
Prawdopodobieństwo warunkowe zajścia zdarzenia A , przy założeniu, że zaszło zdarzenie B , oblicza się w następujący sposób: P(A|B) = P(A∩B) / P(B) Złoto: P(A∩B) = prawdopodobieństwo wystąpienia zarówno zdarzenia A , jak i zdarzenia B. P(B) = prawdopodobieństwo wystąpienia zdarzenia...
Aby dostosować pozycje etykiet osi w Matplotlib, możesz użyć następującej podstawowej składni: #adjust y-axis label position ax. yaxis . set_label_coords (-.1, .5) #adjust x-axis label position ax. xaxis . set_label_coords (.5, -.1) Poniższe przykłady pokazują, jak używać tej składni w praktyce....
Aby dostosować rozmiar bin histogramów w Matplotlib, możesz użyć dowolnej z następujących metod: Metoda 1: Określ liczbę pojemników plt. hist (data, bins= 6 ) Metoda 2: Określ granice segmentów plt. hist (data, bins=[0, 4, 8, 12, 16, 20]) Metoda 3: Określ...
Reszty Pearsona wykorzystuje się w teście niezależności chi-kwadrat w celu analizy różnicy między obserwowaną liczbą komórek a oczekiwaną liczbą komórek w tabeli kontyngencji. Wzór na obliczenie reszty Pearsona jest następujący: r ij = (O ij – E ij ) / √...
Testy chi-kwadrat i ANOVA („analiza wariancji”) to dwa powszechnie stosowane testy statystyczne. Dlatego ważne jest, aby zrozumieć różnicę między tymi dwoma testami i wiedzieć, kiedy zastosować każdy z nich. Ten samouczek zawiera proste wyjaśnienie różnic między tymi dwoma testami, a także...
W statystyce istnieją dwa różne typy testów Chi-kwadrat: 1. Test dobroci dopasowania chi-kwadrat – używany do określenia, czy zmienna kategoryczna ma rozkład hipotetyczny. 2. Test niezależności Chi-kwadrat – używany do określenia, czy istnieje istotny związek pomiędzy dwiema zmiennymi kategorycznymi. W tym...
Błąd, który możesz napotkać podczas korzystania z pand, to: ValueError : cannot convert float NaN to integer Ten błąd występuje podczas próby przekonwertowania kolumny w ramce danych pandy z liczby zmiennoprzecinkowej na liczbę całkowitą, gdy kolumna zawiera wartości NaN. Poniższy przykład...