Ryzyko przypisywane odnosi się do różnicy we wskaźnikach zachorowań pomiędzy osobami narażonymi na czynnik ryzyka a osobami nienarażonymi na ten czynnik ryzyka. Na przykład moglibyśmy zastosować tę miarę, aby zrozumieć różnicę w częstości występowania chorób sercowo-naczyniowych pomiędzy palaczami (osobami narażonymi) i...
Regresja liniowa to metoda, którą możemy zastosować do ilościowego określenia związku między jedną lub większą liczbą zmiennych predykcyjnych azmienną odpowiedzi . Zwykle używamy regresji liniowej ze zmiennymi ilościowymi . Czasami nazywane zmiennymi „numerycznymi” i są to zmienne reprezentujące mierzalną wielkość. Przykłady...
Zmienna fikcyjna to typ zmiennej, który tworzymy w analizie regresji, abyśmy mogli przedstawić zmienną kategorialną jako zmienną numeryczną, która przyjmuje jedną z dwóch wartości: zero lub jeden. Załóżmy na przykład, że mamy następujący zestaw danych i chcemy wykorzystać wiek i stan...
Zmienna fikcyjna to typ zmiennej, który tworzymy w analizie regresji, abyśmy mogli przedstawić zmienną kategorialną jako zmienną numeryczną, która przyjmuje jedną z dwóch wartości: zero lub jeden. Załóżmy na przykład, że mamy następujący zestaw danych i chcemy wykorzystać wiek i stan...
Regresja liniowa to metoda, którą możemy zastosować do ilościowego określenia związku między jedną lub większą liczbą zmiennych predykcyjnych azmienną odpowiedzi . Zwykle używamy regresji liniowej ze zmiennymi ilościowymi . Czasami nazywane zmiennymi „numerycznymi” i są to zmienne reprezentujące mierzalną wielkość. Przykłady...
Dwa terminy, czasami używane zamiennie, to korelacja i skojarzenie . Jednak w dziedzinie statystyki te dwa terminy mają nieco inne znaczenie. W szczególności, gdy używamy słowa korelacja , zwykle mówimy o współczynniku korelacji Pearsona . Jest to miara liniowego powiązania pomiędzy...
Możemy użyć funkcji DATEDIF() do obliczenia różnicy między dwiema datami w Excelu. Ta funkcja wykorzystuje następującą składnię: =DATEDIF(data_początkowa, data_końcowa, metryka) Złoto: Start_Date: data rozpoczęcia End_Date: data końcowa Metryka: metryka do obliczenia. Opcje obejmują: „d”: dni „m”: miesiąc „y”: lata Należy pamiętać,...
W statystyce mówi się, że rozkład prawdopodobieństwa ma właściwość braku pamięci , jeśli wystąpienie zdarzeń przeszłych nie wpływa na prawdopodobieństwo wystąpienia przyszłego zdarzenia. Istnieją tylko dwa rozkłady prawdopodobieństwa z właściwością bez pamięci: Rozkład wykładniczy z nieujemnymi liczbami rzeczywistymi. Rozkład geometryczny z...
Możemy użyć funkcji pmax() , aby znaleźć maksymalną wartość w wielu kolumnach R. Ta funkcja wykorzystuje następującą składnię: pmax(…, na.rm = FAŁSZ) Złoto: … : Lista wektorów na.rm: Element logiczny wskazujący, czy należy usunąć brakujące wartości. Wartość domyślna to fałsz. W...
Funkcji str_replace() pakietu stringr w R można użyć do zastąpienia pasujących wzorców w ciągu znaków. Ta funkcja wykorzystuje następującą składnię: str_replace(ciąg, wzór, zamiana) Złoto: ciąg znaków: wektor znakowy model: Model do wyszukania zastąpienie: wektor znaków zastępczych W tym samouczku przedstawiono kilka...