Do pomiaru dokładności predykcyjnej modeli powszechnie stosuje się średni bezwzględny błąd procentowy (MAPE) . Oblicza się go w następujący sposób: MAPE = (1/n) * Σ(|rzeczywista – prognoza| / |rzeczywista|) * 100 Złoto: Σ – symbol oznaczający „sumę” n – wielkość próby...
Błąd średniokwadratowy (MSE) to powszechny sposób pomiaru dokładności przewidywania modelu. Oblicza się go w następujący sposób: MSE = (1/n) * Σ(rzeczywista – prognoza) 2 Złoto: Σ – fantazyjny symbol oznaczający „sumę” n – wielkość próby real – rzeczywista wartość danych prognoza...
„Krzywa dzwonowa” to nazwa nadana kształtowi rozkładu normalnego , który ma wyraźny kształt „dzwonu”: W tym samouczku wyjaśniono, jak utworzyć krzywą dzwonową w języku Python. Jak utworzyć krzywą dzwonową w Pythonie Poniższy kod pokazuje, jak utworzyć krzywą dzwonową przy użyciu bibliotek...
W statystyce grupowanie to proces umieszczania wartości liczbowych w grupach . Najbardziej popularną formą grupowania jest grupowanie o równej szerokości , w którym dzielimy zbiór danych na k grup o równej szerokości. Mniej powszechnie stosowaną formą grupowania jest grupowanie o równej...
Załóżmy, że mamy następujący zbiór danych w Pythonie, który wyświetla liczbę sprzedaży dokonanej przez określony sklep każdego dnia tygodnia przez pięć tygodni: import numpy as np import pandas as pd import seaborn as sns #create a dataset np.random.seed(0) data = {'day':...
Piramida populacji to wykres przedstawiający rozkład wieku i płci w danej populacji. Jest to przydatne do zrozumienia składu populacji i trendu wzrostu populacji. W tym samouczku wyjaśniono, jak utworzyć następującą piramidę populacji w Pythonie: Piramida wieku w Pythonie Załóżmy, że mamy...
Indeks podobieństwa Jaccarda mierzy podobieństwo między dwoma zbiorami danych. Może wynosić od 0 do 1. Im wyższa liczba, tym bardziej podobne są dwa zestawy danych. Wskaźnik podobieństwa Jaccarda oblicza się w następujący sposób: Podobieństwo Jaccarda = (liczba obserwacji w obu zbiorach)...
Test McNemara służy do określenia, czy istnieje statystycznie istotna różnica w proporcjach pomiędzy sparowanymi danymi. W tym samouczku wyjaśniono, jak wykonać test McNemara w języku Python. Przykład: test McNemara w Pythonie Załóżmy, że badacze chcą wiedzieć, czy określony film marketingowy może...
Dokładny test Fishera służy do określenia, czy istnieje istotny związek między dwiema zmiennymi kategorycznymi. Jest powszechnie stosowany jako alternatywa dla testu niezależności chi-kwadrat, gdy liczba co najmniej jednej komórki w tabeli 2 × 2 jest mniejsza niż 5. W tym samouczku...
Test dobroci dopasowania chi-kwadrat służy do określenia, czy zmienna kategoryczna ma rozkład hipotetyczny. W tym samouczku wyjaśniono, jak przeprowadzić test dobroci dopasowania chi-kwadrat w języku Python. Przykład: test zgodności chi-kwadrat w Pythonie Właściciel sklepu twierdzi, że w każdym dniu tygodnia do...