R でチルダ演算子 (~) を使用する方法
R でチルダ演算子 ( ~ ) を使用すると、方程式の左側と右側を分離できます。
この演算子は、R のlm()関数で最も一般的に使用され、線形回帰モデルの近似に使用されます。
lm() 関数の基本構文は次のとおりです。
model <- lm(y ~ x1 + x2, data=df)
チルダ (y) 演算子の左側の変数名は、応答変数を表します。
チルダ演算子の右側の変数名 (x1、x2) は、予測子変数を表します。
次の例は、さまざまなシナリオでこのチルダ演算子を使用する方法を示しています。
例 1: 予測子変数でのチルダ演算子の使用
次の単純な線形回帰モデルを R に当てはめるとします。
model <- lm(y ~ x, data=df)
この特定の回帰モデルには、応答変数 (y) と予測変数 (x) があります。
この回帰式を統計表記で書くと、次のようになります。
y = β 0 + β 1 x
例 2: 複数の予測子変数でチルダ演算子を使用する
次の重線形回帰モデルを R に当てはめるとします。
model <- lm(y ~ x1 + x2 + x3, data=df)
この特定の回帰モデルには、1 つの応答変数 (y) と 3 つの予測変数 (x1、x2、x3) があります。
この回帰式を統計表記で書くと、次のようになります。
y = β 0 + β 1 × 1 + β 2 × 2 + β 3 × 3
例 3: 未知の数の予測子変数でチルダ演算子を使用する
次の重線形回帰モデルを R に当てはめるとします。
model <- lm(y ~ ., data=df)
この特定の構文は、 yを応答変数として使用し、データ フレーム内の他のすべての変数を予測変数として使用することを示しています。
この構文は、大量の予測子変数を使用して回帰モデルを近似したいが、各予測子変数の個別の名前を入力したくない場合に便利です。
追加リソース
次のチュートリアルでは、R の他の一般的な関数の使用方法について説明します。
R でドル記号演算子 ($) を使用する方法
R で「NOT IN」演算子を使用する方法
R で %in% 演算子を使用する方法