Cara menggunakan operator tilde (~) di r
Anda dapat menggunakan operator tilde ( ~ ) di R untuk memisahkan ruas kiri persamaan dari ruas kanan.
Operator ini paling sering digunakan dengan fungsi lm() di R, yang digunakan untuk menyesuaikan model regresi linier .
Sintaks dasar fungsi lm() adalah:
model <- lm(y ~ x1 + x2, data=df)
Nama variabel di sebelah kiri operator tilde (y) mewakili variabel respon .
Nama variabel di sebelah kanan operator tilde (x1, x2) mewakili variabel prediktor .
Contoh berikut menunjukkan cara menggunakan operator tilde ini dalam skenario yang berbeda.
Contoh 1: Menggunakan Operator Tilde dengan Variabel Prediktor
Misalkan kita memasukkan model regresi linier sederhana berikut ke dalam R:
model <- lm(y ~ x, data=df)
Model regresi khusus ini memiliki variabel respon (y) dan variabel prediktor (x).
Jika persamaan regresi ini kita tulis dalam notasi statistik, maka akan terlihat seperti ini:
kamu = β 0 + β 1 x
Contoh 2: Menggunakan Operator Tilde dengan Banyak Variabel Prediktor
Misalkan kita memasukkan model regresi linier berganda berikut ke dalam R:
model <- lm(y ~ x1 + x2 + x3, data=df)
Model regresi khusus ini memiliki satu variabel respon (y) dan tiga variabel prediktor (x1, x2, x3).
Jika persamaan regresi ini kita tulis dalam notasi statistik, maka akan terlihat seperti ini:
kamu = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3
Contoh 3: Menggunakan operator Tilde dengan jumlah variabel prediktor yang tidak diketahui
Misalkan kita memasukkan model regresi linier berganda berikut ke dalam R:
model <- lm(y ~ ., data=df)
Sintaks khusus ini menunjukkan bahwa kami ingin menggunakan y sebagai variabel respons dan semua variabel lain dalam bingkai data sebagai variabel prediktor.
Sintaks ini berguna ketika kita ingin menyesuaikan model regresi dengan banyak variabel prediktor, namun kita tidak ingin memasukkan nama individual dari setiap variabel prediktor.
Sumber daya tambahan
Tutorial berikut menjelaskan cara menggunakan fungsi umum lainnya di R:
Cara menggunakan operator tanda dolar ($) di R
Cara menggunakan operator “NOT IN” di R
Cara menggunakan operator %in% di R