R에서 물결표 연산자(~)를 사용하는 방법

에 의해 벤자민 앤더슨 7월 19, 2023 가이드 댓글 0개

R에서 물결표 연산자( ~ )를 사용하여 방정식의 왼쪽과 오른쪽을 구분할 수 있습니다.

이 연산자는 선형 회귀 모델을 맞추는 데 사용되는 R의 lm() 함수와 함께 가장 일반적으로 사용됩니다.

lm() 함수의 기본 구문은 다음과 같습니다.

 model <- lm(y ~ x1 + x2, data=df)

물결표(y) 연산자 왼쪽 의 변수 이름은 응답 변수를 나타냅니다.

물결표 연산자 오른쪽 에 있는 변수 이름(x1, x2)은 예측 변수를 나타냅니다.

다음 예에서는 다양한 시나리오에서 이 물결표 연산자를 사용하는 방법을 보여줍니다.

R에 다음과 같은 단순 선형 회귀 모델을 적합하다고 가정합니다.

 model <- lm(y ~ x, data=df)

이 특정 회귀 모델에는 응답 변수(y)와 예측 변수(x)가 있습니다.

이 회귀 방정식을 통계 표기법으로 작성하면 다음과 같습니다.

y = β ₀ + β ₁ x

R에 다음과 같은 다중 선형 회귀 모델을 적합하다고 가정합니다.

 model <- lm(y ~ x1 + x2 + x3, data=df)

이 특정 회귀 모델에는 하나의 응답 변수(y)와 세 개의 예측 변수(x1, x2, x3)가 있습니다.

이 회귀 방정식을 통계 표기법으로 작성하면 다음과 같습니다.

y = β ₀ + β ₁ x ₁ + β ₂ x ₂ + β ₃ x ₃

R에 다음과 같은 다중 선형 회귀 모델을 적합하다고 가정합니다.

 model <- lm(y ~ ., data=df)

이 특정 구문은 y를 응답 변수로 사용하고 데이터 프레임의 다른 모든 변수를 예측 변수로 사용한다는 것을 나타냅니다.

이 구문은 수많은 예측 변수를 사용하여 회귀 모델을 맞추려고 하지만 각 예측 변수의 개별 이름을 입력하고 싶지 않을 때 유용합니다.

다음 튜토리얼에서는 R에서 다른 일반적인 기능을 사용하는 방법을 설명합니다.

안녕하세요. 저는 통계학 교수를 퇴직하고 전임 통계 교사로 변신한 벤자민입니다. 통계 분야의 광범위한 경험과 전문 지식을 바탕으로 Statorials를 통해 학생들에게 힘을 실어주기 위해 지식을 공유하고 싶습니다. 더 알아보기