Как использовать оператор тильда (~) в r


Вы можете использовать оператор тильды ( ~ ) в R, чтобы отделить левую часть уравнения от правой.

Этот оператор чаще всего используется с функцией lm() в R, которая используется для подбора моделей линейной регрессии .

Основной синтаксис функции lm():

 model <- lm(y ~ x1 + x2, data=df)

Имя переменной слева от оператора тильды (y) представляет собой переменную ответа .

Имена переменных в правой части оператора тильды (x1, x2) представляют собой переменные-предикторы .

В следующих примерах показано, как использовать этот оператор тильды в различных сценариях.

Пример 1. Использование оператора тильды с переменной-предиктором

Предположим, мы подгоняем следующую простую модель линейной регрессии в R:

 model <- lm(y ~ x, data=df)

Эта конкретная модель регрессии имеет переменную ответа (y) и переменную-предиктор (x).

Если бы мы записали это уравнение регрессии в статистической записи, оно выглядело бы так:

у = β 0 + β 1 х

Пример 2. Использование оператора тильды с несколькими переменными-предикторами

Предположим, мы подгоняем следующую модель множественной линейной регрессии в R:

 model <- lm(y ~ x1 + x2 + x3, data=df)

Эта конкретная модель регрессии имеет одну переменную ответа (y) и три переменные-предикторы (x1, x2, x3).

Если бы мы записали это уравнение регрессии в статистической записи, оно выглядело бы так:

у = β 0 + β 1 х 1 + β 2 х 2 + β 3 х 3

Пример 3. Использование оператора Тильда с неизвестным количеством переменных-предикторов.

Предположим, мы подгоняем следующую модель множественной линейной регрессии в R:

 model <- lm(y ~ ., data=df)

Этот конкретный синтаксис указывает, что мы хотели бы использовать y в качестве переменной ответа, а все остальные переменные в кадре данных — в качестве переменных-предсказателей.

Этот синтаксис полезен, когда мы хотим подогнать модель регрессии к множеству переменных-предикторов, но не хотим вводить индивидуальное имя каждой переменной-предиктора.

Дополнительные ресурсы

В следующих руководствах объясняется, как использовать другие распространенные функции в R:

Как использовать оператор знака доллара ($) в R
Как использовать оператор «НЕ В» в R
Как использовать оператор %in% в R

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *