Jednym z kluczowych założeń regresji liniowej jest to, że reszty mają rozkład z równą wariancją na każdym poziomie zmiennej predykcyjnej. Założenie to znane jest jako homoskedastyczność . Jeżeli to założenie nie jest przestrzegane, w resztach występuje heteroskedastyczność . Kiedy tak się...
Wynik Stanine’a , skrót od „standardowy wynik dziewięć”, to sposób skalowania wyników testów w standardowej dziewięciopunktowej skali. Stosując tę metodę, możemy przekonwertować każdy wynik testu z pierwotnego wyniku (tj. od 0 do 100) na liczbę z zakresu od 1 do 9....
W statystyce decyle to liczby dzielące zbiór danych na dziesięć grup o jednakowej częstotliwości. Pierwszy decyl to punkt, poniżej którego spada 10% wszystkich wartości danych. Drugi decyl to punkt, w którym 20% wszystkich wartości danych spada poniżej i tak dalej. Do...
Reszta to różnica między wartością obserwowaną a wartością przewidywaną w modelu regresji. Oblicza się go w następujący sposób: Wartość rezydualna = Wartość obserwowana – Wartość przewidywana Jednym ze sposobów sprawdzenia, jak dobrze model regresji pasuje do zbioru danych, jest obliczenie resztowej...
Reszta to różnica między wartością obserwowaną a wartością przewidywaną w modelu regresji. Oblicza się go w następujący sposób: Wartość rezydualna = Wartość obserwowana – Wartość przewidywana Jednym ze sposobów sprawdzenia, jak dobrze model regresji pasuje do zbioru danych, jest obliczenie resztowej...
Jednym z głównych założeń regresji liniowej jest to, że reszty mają rozkład normalny. Jednym ze sposobów wizualnej weryfikacji tego założenia jest utworzenie histogramu reszt i obserwacja, czy rozkład ma kształt dzwonu przypominający rozkład normalny . W tym samouczku przedstawiono krok po...
Wartość odstająca to obserwacja , która jest nienormalnie odległa od innych wartości w zbiorze danych. Wartości odstające mogą być problematyczne, ponieważ mogą wpływać na wyniki analizy. Powszechnym sposobem wykrywania wartości odstających w zbiorze danych jest użycie rozstępu międzykwartylowego . Rozstęp międzykwartylowy,...
Często w statystyce interesuje nas pomiar parametrów populacji , czyli liczb opisujących pewne cechy całej populacji. Dwa z najczęstszych parametrów populacji to: 1. Średnia populacji: średnia wartość zmiennej w populacji (na przykład średni wzrost mężczyzn w danym mieście) 2. Proporcja populacji:...
Wykres pudełkowy to rodzaj wykresu przedstawiający pięciocyfrowe podsumowanie zbioru danych, które obejmuje: Wartość minimalna Pierwszy kwartyl (25. percentyl) Wartość średnia Trzeci kwartyl (75. percentyl) Maksymalna wartość Aby sporządzić wykres pudełkowy, rysujemy pudełko od pierwszego do trzeciego kwartyla. Następnie rysujemy pionową linię...
Biorąc pod uwagę dwa zdarzenia, A i B, „znalezienie prawdopodobieństwa A i B” oznacza znalezienie prawdopodobieństwa wystąpienia zarówno zdarzenia A, jak i zdarzenia B. Zwykle zapisujemy to prawdopodobieństwo na dwa sposoby: P(A i B) – Forma pisemna P(A∩B) – zapis formy...