Jak używać operatora tyldy (~) w r

Przez Benjamin Anderson 19 lipca, 2023 Przewodnik 0 komentarzy

Możesz użyć operatora tyldy ( ~ ) w R, aby oddzielić lewą stronę równania od prawej.

Operator ten jest najczęściej używany z funkcją lm() w języku R, która służy do dopasowywania modeli regresji liniowej .

Podstawowa składnia funkcji lm() jest następująca:

 model <- lm(y ~ x1 + x2, data=df)

Nazwa zmiennej po lewej stronie operatora tyldy (y) reprezentuje zmienną odpowiedzi .

Nazwy zmiennych po prawej stronie operatora tyldy (x1, x2) reprezentują zmienne predykcyjne .

Poniższe przykłady pokazują, jak używać tego operatora tyldy w różnych scenariuszach.

Przykład 1: Użycie operatora tyldy ze zmienną predykcyjną

Załóżmy, że dopasowujemy następujący prosty model regresji liniowej w R:

 model <- lm(y ~ x, data=df)

Ten konkretny model regresji ma zmienną odpowiedzi (y) i zmienną predykcyjną (x).

Gdybyśmy zapisali to równanie regresji w notacji statystycznej, wyglądałoby to tak:

y = β ₀ + β ₁ x

Przykład 2: Używanie operatora tyldy z wieloma zmiennymi predykcyjnymi

Załóżmy, że dopasowujemy następujący model regresji liniowej w R:

 model <- lm(y ~ x1 + x2 + x3, data=df)

Ten konkretny model regresji ma jedną zmienną odpowiedzi (y) i trzy zmienne predykcyjne (x1, x2, x3).

Gdybyśmy zapisali to równanie regresji w notacji statystycznej, wyglądałoby to tak:

y = β ₀ + β ₁ x ₁ + β ₂ x ₂ + β ₃ x ₃

Przykład 3: Użycie operatora tyldy z nieznaną liczbą zmiennych predykcyjnych

Załóżmy, że dopasowujemy następujący model regresji liniowej w R:

 model <- lm(y ~ ., data=df)

Ta szczególna składnia wskazuje, że chcielibyśmy użyć y jako zmiennej odpowiedzi, a wszystkich innych zmiennych w ramce danych jako zmiennych predykcyjnych.

Ta składnia jest przydatna, gdy chcemy dopasować model regresji do dużej liczby zmiennych predykcyjnych, ale nie chcemy wprowadzać indywidualnej nazwy każdej zmiennej predykcyjnej.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak korzystać z innych typowych funkcji w R:

Jak używać operatora znaku dolara ($) w R
Jak używać operatora „NOT IN” w R
Jak używać operatora%in% w R

o autorze

Dr Benjamin Anderson

Cześć, jestem Benjamin i jestem emerytowanym profesorem statystyki, który został oddanym nauczycielem Statorials. Dzięki bogatemu doświadczeniu i wiedzy specjalistycznej w dziedzinie statystyki chętnie dzielę się swoją wiedzą, aby wzmocnić pozycję uczniów za pośrednictwem Statorials. Wiedzieć więcej