Dwa terminy, które uczniowie często mylą w statystyce, to prawdopodobieństwo i proporcja . Oto różnica: Prawdopodobieństwo oznacza prawdopodobieństwo wystąpienia zdarzenia. To teoretyczne . Proporcja podsumowuje, jak często dane zdarzenie faktycznie miało miejsce. To empiryczne . Często używamy prawdopodobieństwa, gdy mówimy o...
Ryzyko względne jest często obliczane podczas analizy tabeli 2×2, która ma następujący format: Ryzyko względne mówi nam o prawdopodobieństwie wystąpienia zdarzenia w grupie badanej w porównaniu z prawdopodobieństwem wystąpienia zdarzenia w grupie kontrolnej. Oblicza się go w następujący sposób: Ryzyko względne...
W statystyce wszystkie zmienne mierzone są w jednej z czterech skal pomiarowych: Nominalny : Zmienne, które nie mają wartości ilościowych. Porządkowe : zmienne, które mają naturalny porządek, ale nie mają wymiernej różnicy między wartościami. Przedział : Zmienne, które mają naturalny porządek...
Wariancja to sposób pomiaru rozkładu wartości w zbiorze danych. Wzór na obliczenie wariancji populacji jest następujący: σ 2 = Σ (x i – μ) 2 / N Złoto: Σ : Symbol oznaczający „sumę” μ : średnia populacji x i : I-...
Regresja liniowa to technika, której używamy do ilościowego określenia związku między jedną lub większą liczbą zmiennych predykcyjnych azmienną odpowiedzi . Jednym z kluczowych założeń regresji liniowej jest to, że reszty mają stałą wariancję na każdym poziomie zmiennych predykcyjnych. Jeżeli to założenie...
W statystyce iloraz szans informuje nas o stosunku szans na wystąpienie zdarzenia w grupie badanej do szans na wystąpienie zdarzenia w grupie kontrolnej. Kiedy zgłaszamy iloraz szans, zazwyczaj uwzględniamy następujące informacje: Wartość ilorazu szans Przedział ufności dla ilorazu szans Jak interpretować...
Regresja logistyczna to rodzaj analizy regresji, którą stosujemy, gdyzmienna odpowiedzi jest binarna. Do raportowania wyników modelu regresji logistycznej możemy użyć następującego ogólnego formatu: Do analizy związku pomiędzy [zmienną predykcyjną 1], [zmienną predykcyjną 2],… [zmienną predykcyjną n ] i [zmienną odpowiedzi] wykorzystano...
Regresja wielomianowa to technika, której możemy użyć do dopasowania modelu regresji, gdy związek między zmiennymi predykcyjnymi a zmienną odpowiedzi jest nieliniowy. Model regresji wielomianowej ma następującą postać: Y = β 0 + β 1 X + β 2 X 2 +...
W statystyce zmienna pojęciowa reprezentuje konstrukt lub byt abstrakcyjny, który chcemy zmierzyć. Jednakże nie możemy bezpośrednio zmierzyć zmiennej pojęciowej, dlatego zamiast tego używamy rzeczywistego pomiaru w celu ilościowego określenia zmiennej pojęciowej. Załóżmy na przykład, że badacz chce ocenić „ogólne szczęście” poszczególnych...
Błąd, który możesz napotkać podczas korzystania z pand, to: ValueError : Can only compare identically-labeled DataFrame objects Ten błąd występuje, gdy próbujesz porównać dwie ramki danych pand, a etykiety indeksu lub etykiety kolumn nie pasują idealnie. Poniższy przykład pokazuje, jak w...