R에서 물결표 연산자(~)를 사용하는 방법


R에서 물결표 연산자( ~ )를 사용하여 방정식의 왼쪽과 오른쪽을 구분할 수 있습니다.

이 연산자는 선형 회귀 모델을 맞추는 데 사용되는 R의 lm() 함수와 함께 가장 일반적으로 사용됩니다.

lm() 함수의 기본 구문은 다음과 같습니다.

 model <- lm(y ~ x1 + x2, data=df)

물결표(y) 연산자 왼쪽 의 변수 이름은 응답 변수를 나타냅니다.

물결표 연산자 오른쪽 에 있는 변수 이름(x1, x2)은 예측 변수를 나타냅니다.

다음 예에서는 다양한 시나리오에서 이 물결표 연산자를 사용하는 방법을 보여줍니다.

예 1: 예측 변수와 함께 물결표 연산자 사용

R에 다음과 같은 단순 선형 회귀 모델을 적합하다고 가정합니다.

 model <- lm(y ~ x, data=df)

이 특정 회귀 모델에는 응답 변수(y)와 예측 변수(x)가 있습니다.

이 회귀 방정식을 통계 표기법으로 작성하면 다음과 같습니다.

y = β 0 + β 1 x

예 2: 여러 예측 변수에 물결표 연산자 사용

R에 다음과 같은 다중 선형 회귀 모델을 적합하다고 가정합니다.

 model <- lm(y ~ x1 + x2 + x3, data=df)

이 특정 회귀 모델에는 하나의 응답 변수(y)와 세 개의 예측 변수(x1, x2, x3)가 있습니다.

이 회귀 방정식을 통계 표기법으로 작성하면 다음과 같습니다.

y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3

예 3: 알 수 없는 수의 예측 변수에 물결표 연산자 사용

R에 다음과 같은 다중 선형 회귀 모델을 적합하다고 가정합니다.

 model <- lm(y ~ ., data=df)

이 특정 구문은 y를 응답 변수로 사용하고 데이터 프레임의 다른 모든 변수를 예측 변수로 사용한다는 것을 나타냅니다.

이 구문은 수많은 예측 변수를 사용하여 회귀 모델을 맞추려고 하지만 각 예측 변수의 개별 이름을 입력하고 싶지 않을 때 유용합니다.

추가 리소스

다음 튜토리얼에서는 R에서 다른 일반적인 기능을 사용하는 방법을 설명합니다.

R에서 달러 기호 연산자($)를 사용하는 방법
R에서 “NOT IN” 연산자를 사용하는 방법
R에서 %in% 연산자를 사용하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다