Як використовувати оператор тильди (~) у r
Ви можете використовувати оператор тильди ( ~ ) у R, щоб відокремити ліву частину рівняння від правої.
Цей оператор найчастіше використовується з функцією lm() у R, яка використовується для підгонки моделей лінійної регресії .
Основний синтаксис функції lm() такий:
model <- lm(y ~ x1 + x2, data=df)
Ім’я змінної зліва від оператора тильди (y) представляє змінну відповіді .
Назви змінних у правій частині оператора тильди (x1, x2) представляють змінні предиктора .
У наведених нижче прикладах показано, як використовувати цей оператор тильди в різних сценаріях.
Приклад 1: використання оператора тильди зі змінною прогнозу
Припустімо, що ми використовуємо таку просту модель лінійної регресії в R:
model <- lm(y ~ x, data=df)
Ця конкретна модель регресії має змінну відповіді (y) і змінну предиктора (x).
Якщо ми напишемо це рівняння регресії в статистичній нотації, воно виглядатиме так:
y = β 0 + β 1 x
Приклад 2: Використання оператора тильди з декількома змінними предиктора
Припустімо, що ми використовуємо таку модель множинної лінійної регресії в R:
model <- lm(y ~ x1 + x2 + x3, data=df)
Ця конкретна регресійна модель має одну змінну відповіді (y) і три змінні предиктора (x1, x2, x3).
Якщо ми напишемо це рівняння регресії в статистичній нотації, воно виглядатиме так:
y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3
Приклад 3: використання оператора тильди з невідомою кількістю змінних предиктора
Припустімо, що ми використовуємо таку модель множинної лінійної регресії в R:
model <- lm(y ~ ., data=df)
Цей конкретний синтаксис вказує на те, що ми хотіли б використовувати y як змінну відповіді та всі інші змінні у кадрі даних як змінні предиктора.
Цей синтаксис корисний, коли ми хочемо підібрати модель регресії з безліччю змінних предиктора, але ми не хочемо вводити окрему назву кожної змінної предиктора.
Додаткові ресурси
У наступних посібниках пояснюється, як використовувати інші поширені функції в R:
Як використовувати оператор знака долара ($) у R
Як використовувати оператор «NOT IN» у R
Як використовувати оператор %in% у R