Jak używać operatora tyldy (~) w r
Możesz użyć operatora tyldy ( ~ ) w R, aby oddzielić lewą stronę równania od prawej.
Operator ten jest najczęściej używany z funkcją lm() w języku R, która służy do dopasowywania modeli regresji liniowej .
Podstawowa składnia funkcji lm() jest następująca:
model <- lm(y ~ x1 + x2, data=df)
Nazwa zmiennej po lewej stronie operatora tyldy (y) reprezentuje zmienną odpowiedzi .
Nazwy zmiennych po prawej stronie operatora tyldy (x1, x2) reprezentują zmienne predykcyjne .
Poniższe przykłady pokazują, jak używać tego operatora tyldy w różnych scenariuszach.
Przykład 1: Użycie operatora tyldy ze zmienną predykcyjną
Załóżmy, że dopasowujemy następujący prosty model regresji liniowej w R:
model <- lm(y ~ x, data=df)
Ten konkretny model regresji ma zmienną odpowiedzi (y) i zmienną predykcyjną (x).
Gdybyśmy zapisali to równanie regresji w notacji statystycznej, wyglądałoby to tak:
y = β 0 + β 1 x
Przykład 2: Używanie operatora tyldy z wieloma zmiennymi predykcyjnymi
Załóżmy, że dopasowujemy następujący model regresji liniowej w R:
model <- lm(y ~ x1 + x2 + x3, data=df)
Ten konkretny model regresji ma jedną zmienną odpowiedzi (y) i trzy zmienne predykcyjne (x1, x2, x3).
Gdybyśmy zapisali to równanie regresji w notacji statystycznej, wyglądałoby to tak:
y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3
Przykład 3: Użycie operatora tyldy z nieznaną liczbą zmiennych predykcyjnych
Załóżmy, że dopasowujemy następujący model regresji liniowej w R:
model <- lm(y ~ ., data=df)
Ta szczególna składnia wskazuje, że chcielibyśmy użyć y jako zmiennej odpowiedzi, a wszystkich innych zmiennych w ramce danych jako zmiennych predykcyjnych.
Ta składnia jest przydatna, gdy chcemy dopasować model regresji do dużej liczby zmiennych predykcyjnych, ale nie chcemy wprowadzać indywidualnej nazwy każdej zmiennej predykcyjnej.
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak korzystać z innych typowych funkcji w R:
Jak używać operatora znaku dolara ($) w R
Jak używać operatora „NOT IN” w R
Jak używać operatora%in% w R