Jedną z najczęściej używanych metryk do pomiaru dokładności prognozy modelu jest MAPE , co oznacza średni bezwzględny błąd procentowy . Wzór do obliczenia MAPE jest następujący: MAPE = (1/n) * Σ(|rzeczywista – prognoza| / |rzeczywista|) * 100 Złoto: Σ – fantazyjny...
Wykres kołowy to wykres kołowy, na którym do wyświetlania względnych rozmiarów danych wykorzystywane są „kołowe”. W tym samouczku wyjaśniono, jak tworzyć i edytować wykresy kołowe w Stata. Jak tworzyć wykresy kołowe w Stata Użyjemy zbioru danych zwanego spisem , aby zilustrować,...
Wykres QQ , skrót od „kwantyl-kwantyl”, jest często używany do oceny, czy reszty z analizy regresji mają rozkład normalny, czy nie. W tym samouczku wyjaśniono, jak utworzyć i zinterpretować wykres QQ w Stata. Przykład: wykres QQ w Stata W tym przykładzie...
Regresja logistyczna to metoda statystyczna, której używamy do dopasowania modelu regresji, gdy zmienna odpowiedzi jest binarna. Aby ocenić, jak dobrze model regresji logistycznej pasuje do zbioru danych, możemy przyjrzeć się następującym dwóm metrykom: Czułość: prawdopodobieństwo, że model przewiduje pozytywny wynik obserwacji,...
Jednoczynnikową analizę ANOVA stosuje się w celu ustalenia, czy różne poziomy zmiennej objaśniającej prowadzą do statystycznie różnych wyników w przypadku określonych zmiennych odpowiedzi. Na przykład możemy być zainteresowani zrozumieniem, czy trzy poziomy wykształcenia (stopień nadzwyczajny, licencjat, tytuł magistra) prowadzą do statystycznie...
Regresja liniowa to metoda, której możemy użyć do zrozumienia związku między jedną lub większą liczbą zmiennych objaśniających a zmienną odpowiedzi. Zwykle, gdy przeprowadzamy regresję liniową, chcemy oszacować średnią wartość zmiennej odpowiedzi na podstawie wartości zmiennej objaśniającej. Zamiast tego moglibyśmy oszacować medianę,...
Wiele testów statystycznych wymaga, aby jedna lub więcej zmiennych miało rozkład normalny , aby wyniki testów były wiarygodne. W tym samouczku wyjaśniono kilka metod, których można użyć do sprawdzenia normalności między zmiennymi w Stata. Dla każdej z tych metod użyjemy wbudowanego...
Wielokolinearność w analizie regresji ma miejsce, gdy dwie lub więcej zmiennych objaśniających jest ze sobą silnie skorelowanych, w związku z czym nie dostarczają unikalnych lub niezależnych informacji w modelu regresji. Jeśli stopień korelacji między zmiennymi jest wystarczająco wysoki, może to powodować...
Test U Manna-Whitneya (czasami nazywany testem sumy rang Wilcoxona) służy do porównywania różnic między dwiema próbami, gdy rozkłady próbek nie mają rozkładu normalnego, a rozmiary próbek są małe (n < 30). Uważa się, że jest to nieparametryczny odpowiednik testu t dla...
Wielokolinearność w analizie regresji ma miejsce, gdy dwie lub więcej zmiennych objaśniających jest ze sobą silnie skorelowanych, w związku z czym nie dostarczają unikalnych lub niezależnych informacji w modelu regresji. Jeśli stopień korelacji między zmiennymi jest wystarczająco wysoki, może to powodować...