Как использовать оператор тильда (~) в r
Вы можете использовать оператор тильды ( ~ ) в R, чтобы отделить левую часть уравнения от правой.
Этот оператор чаще всего используется с функцией lm() в R, которая используется для подбора моделей линейной регрессии .
Основной синтаксис функции lm():
model <- lm(y ~ x1 + x2, data=df)
Имя переменной слева от оператора тильды (y) представляет собой переменную ответа .
Имена переменных в правой части оператора тильды (x1, x2) представляют собой переменные-предикторы .
В следующих примерах показано, как использовать этот оператор тильды в различных сценариях.
Пример 1. Использование оператора тильды с переменной-предиктором
Предположим, мы подгоняем следующую простую модель линейной регрессии в R:
model <- lm(y ~ x, data=df)
Эта конкретная модель регрессии имеет переменную ответа (y) и переменную-предиктор (x).
Если бы мы записали это уравнение регрессии в статистической записи, оно выглядело бы так:
у = β 0 + β 1 х
Пример 2. Использование оператора тильды с несколькими переменными-предикторами
Предположим, мы подгоняем следующую модель множественной линейной регрессии в R:
model <- lm(y ~ x1 + x2 + x3, data=df)
Эта конкретная модель регрессии имеет одну переменную ответа (y) и три переменные-предикторы (x1, x2, x3).
Если бы мы записали это уравнение регрессии в статистической записи, оно выглядело бы так:
у = β 0 + β 1 х 1 + β 2 х 2 + β 3 х 3
Пример 3. Использование оператора Тильда с неизвестным количеством переменных-предикторов.
Предположим, мы подгоняем следующую модель множественной линейной регрессии в R:
model <- lm(y ~ ., data=df)
Этот конкретный синтаксис указывает, что мы хотели бы использовать y в качестве переменной ответа, а все остальные переменные в кадре данных — в качестве переменных-предсказателей.
Этот синтаксис полезен, когда мы хотим подогнать модель регрессии к множеству переменных-предикторов, но не хотим вводить индивидуальное имя каждой переменной-предиктора.
Дополнительные ресурсы
В следующих руководствах объясняется, как использовать другие распространенные функции в R:
Как использовать оператор знака доллара ($) в R
Как использовать оператор «НЕ В» в R
Как использовать оператор %in% в R