Як використовувати оператор тильди (~) у r


Ви можете використовувати оператор тильди ( ~ ) у R, щоб відокремити ліву частину рівняння від правої.

Цей оператор найчастіше використовується з функцією lm() у R, яка використовується для підгонки моделей лінійної регресії .

Основний синтаксис функції lm() такий:

 model <- lm(y ~ x1 + x2, data=df)

Ім’я змінної зліва від оператора тильди (y) представляє змінну відповіді .

Назви змінних у правій частині оператора тильди (x1, x2) представляють змінні предиктора .

У наведених нижче прикладах показано, як використовувати цей оператор тильди в різних сценаріях.

Приклад 1: використання оператора тильди зі змінною прогнозу

Припустімо, що ми використовуємо таку просту модель лінійної регресії в R:

 model <- lm(y ~ x, data=df)

Ця конкретна модель регресії має змінну відповіді (y) і змінну предиктора (x).

Якщо ми напишемо це рівняння регресії в статистичній нотації, воно виглядатиме так:

y = β 0 + β 1 x

Приклад 2: Використання оператора тильди з декількома змінними предиктора

Припустімо, що ми використовуємо таку модель множинної лінійної регресії в R:

 model <- lm(y ~ x1 + x2 + x3, data=df)

Ця конкретна регресійна модель має одну змінну відповіді (y) і три змінні предиктора (x1, x2, x3).

Якщо ми напишемо це рівняння регресії в статистичній нотації, воно виглядатиме так:

y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3

Приклад 3: використання оператора тильди з невідомою кількістю змінних предиктора

Припустімо, що ми використовуємо таку модель множинної лінійної регресії в R:

 model <- lm(y ~ ., data=df)

Цей конкретний синтаксис вказує на те, що ми хотіли б використовувати y як змінну відповіді та всі інші змінні у кадрі даних як змінні предиктора.

Цей синтаксис корисний, коли ми хочемо підібрати модель регресії з безліччю змінних предиктора, але ми не хочемо вводити окрему назву кожної змінної предиктора.

Додаткові ресурси

У наступних посібниках пояснюється, як використовувати інші поширені функції в R:

Як використовувати оператор знака долара ($) у R
Як використовувати оператор «NOT IN» у R
Як використовувати оператор %in% у R

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *