Віднесений ризик стосується різниці в рівнях захворюваності між людьми, які піддаються впливу фактора ризику, і людьми, які не піддаються цьому фактору ризику. Наприклад, ми могли б використати цей показник, щоб зрозуміти різницю в серцево-судинних захворюваннях (захворюваності) між курцями (люди, які зазнали...
Лінійна регресія – це метод, який ми можемо використати для кількісного визначення зв’язку між однією або декількома змінними предиктора та змінною відповіді . Зазвичай ми використовуємо лінійну регресію з кількісними змінними . Іноді їх називають «числовими» змінними, це змінні, які представляють...
Фіктивна змінна — це тип змінної, яку ми створюємо в регресійному аналізі, щоб ми могли представити категоріальну змінну як числову змінну, яка приймає одне з двох значень: нуль або одиницю. Наприклад, припустімо, що ми маємо такий набір даних і хочемо використовувати...
Фіктивна змінна — це тип змінної, яку ми створюємо в регресійному аналізі, щоб ми могли представити категоріальну змінну як числову змінну, яка приймає одне з двох значень: нуль або одиницю. Наприклад, припустімо, що ми маємо такий набір даних і хочемо використовувати...
Лінійна регресія – це метод, який ми можемо використати для кількісного визначення зв’язку між однією або декількома змінними предиктора та змінною відповіді . Зазвичай ми використовуємо лінійну регресію з кількісними змінними . Іноді їх називають «числовими» змінними, це змінні, які представляють...
Два терміни, які іноді використовуються як синоніми, це кореляція та асоціація . Однак у сфері статистики ці два терміни мають дещо різні значення. Зокрема, коли ми використовуємо слово кореляція , ми зазвичай говоримо про коефіцієнт кореляції Пірсона . Це міра лінійного...
Ми можемо використовувати функцію DATEDIF() , щоб обчислити різницю між двома датами в Excel. Ця функція використовує такий синтаксис: =DATEDIF(Дата_початку, дата_кінца, показник) золото: Start_Date: дата початку End_Date: кінцева дата Метрика: метрика для обчислення. Опції включають: «d»: дні «m»: місяць «y»: роки...
У статистиці кажуть, що розподіл ймовірностей має властивість без пам’яті , якщо на ймовірність майбутньої події не впливає настання минулих подій. Існує лише два розподіли ймовірностей із властивістю без пам’яті: Експоненціальний розподіл з невід’ємними дійсними числами. Геометричний розподіл з цілими невід’ємними...
Ми можемо використовувати функцію pmax() , щоб знайти максимальне значення в кількох стовпцях R. Ця функція використовує такий синтаксис: pmax(…, na.rm = FALSE) золото: … : список векторів na.rm: Логічний елемент, який вказує, чи потрібно видалити відсутні значення. Значення за замовчуванням...
Функцію str_replace() пакету stringr у R можна використовувати для заміни відповідних шаблонів у рядку. Ця функція використовує такий синтаксис: str_replace(рядок, шаблон, заміна) золото: рядок: символьний вектор модель: модель для пошуку заміна: вектор символів заміни Цей підручник надає кілька прикладів практичного використання...