Często w statystyce chcemy zbierać dane, abyśmy mogli odpowiedzieć na określone pytania badawcze. Na przykład, możemy chcieć odpowiedzieć na następujące pytania: 1. Jaki jest średni dochód gospodarstwa domowego w Cincinnati w stanie Ohio? 2. Jaka jest średnia waga określonej populacji żółwi?...
Regresja liniowa to metoda, którą możemy wykorzystać do zrozumienia związku między jedną lub większą liczbą zmiennych predykcyjnych azmienną odpowiedzi . Zwykle, gdy przeprowadzamy regresję liniową, chcemy oszacować średnią wartość zmiennej odpowiedzi. Zamiast tego możemy jednak zastosować metodę znaną jako regresja kwantylowa...
Regresja liniowa to metoda, którą możemy wykorzystać do zrozumienia związku między jedną lub większą liczbą zmiennych predykcyjnych azmienną odpowiedzi . Zwykle, gdy przeprowadzamy regresję liniową, chcemy oszacować średnią wartość zmiennej odpowiedzi. Zamiast tego możemy jednak zastosować metodę znaną jako regresja kwantylowa...
Średnia ruchoma to po prostu średnia liczby poprzednich okresów w szeregu czasowym. Aby obliczyć średnią kroczącą jednej lub większej liczby kolumn w ramce DataFrame pand, możemy zastosować następującą składnię: df[' column_name ']. rolling ( rolling_window ). mean () W tym samouczku...
Dwa zdarzenia wykluczają się wzajemnie, jeżeli nie mogą wystąpić jednocześnie. Załóżmy na przykład, że zdarzenie A to zdarzenie, w którym kość wyląduje na liczbie parzystej, a zdarzenie B to zdarzenie, w którym kość wyląduje na liczbie nieparzystej. Zdefiniowalibyśmy przykładową przestrzeń dla...
Zmienna dychotomiczna to typ zmiennej, która przyjmuje tylko dwie możliwe wartości. Oto kilka przykładów zmiennych dychotomicznych: Płeć: mężczyzna lub kobieta Rzut monetą: orzeł lub reszka Typ nieruchomości: mieszkalna lub komercyjna Status sportowca: profesjonalista lub amator Wyniki egzaminu: zdany lub nie Tego...
Istnieją dwa sposoby tworzenia chmury punktów przy użyciu danych z ramki DataFrame pandy: 1. Użyj pandas.DataFrame.plot.scatter Jednym ze sposobów utworzenia wykresu rozrzutu jest użycie wbudowanej funkcji plot.scatter() : import pandas as pd df. plot . scatter (x = ' x_column_name ',...
Eksperyment to kontrolowane badanie naukowe. W statystyce często przeprowadzamy eksperymenty, aby zrozumieć, jak zmiana jednej zmiennej wpływa na inną zmienną. Zmienna manipulowana to taka, którą zmieniamy lub „manipulujemy”, aby zobaczyć, jak ta zmiana wpływa na inną zmienną. Zmienna manipulowana jest czasami...
Jednym z kluczowych założeń regresji liniowej jest to, że reszty mają rozkład z równą wariancją na każdym poziomie zmiennej predykcyjnej. Założenie to znane jest jako homoskedastyczność . Jeżeli to założenie nie jest przestrzegane, mówi się, że w resztach występuje heteroskedastyczność ....