R'de tilde operatörü (~) nasıl kullanılır?
Bir denklemin sol tarafını sağ tarafından ayırmak için R’deki yaklaşık operatörünü ( ~ ) kullanabilirsiniz.
Bu operatör en yaygın olarak R’deki doğrusal regresyon modellerine uyum sağlamak için kullanılan lm() işleviyle birlikte kullanılır.
lm() fonksiyonunun temel sözdizimi şöyledir:
model <- lm(y ~ x1 + x2, data=df)
Tilde (y) operatörünün sol tarafındaki değişken adı , yanıt değişkenini temsil eder.
Tilde operatörünün sağ tarafındaki değişken adları (x1, x2), tahmin değişkenlerini temsil eder.
Aşağıdaki örneklerde bu yaklaşık işareti operatörünün farklı senaryolarda nasıl kullanılacağı gösterilmektedir.
Örnek 1: Tilde Operatörünü Tahmin Edici Değişkenle Kullanmak
R’ye aşağıdaki basit doğrusal regresyon modelini uyduğumuzu varsayalım:
model <- lm(y ~ x, data=df)
Bu özel regresyon modelinde bir yanıt değişkeni (y) ve bir yordayıcı değişken (x) bulunur.
Bu regresyon denklemini istatistiksel gösterimle yazarsak şöyle görünecektir:
y = β 0 + β 1 x
Örnek 2: Tilde Operatörünü Çoklu Tahmin Değişkenleriyle Kullanmak
R’ye aşağıdaki çoklu doğrusal regresyon modelini uyduğumuzu varsayalım:
model <- lm(y ~ x1 + x2 + x3, data=df)
Bu özel regresyon modelinde bir yanıt değişkeni (y) ve üç yordayıcı değişken (x1, x2, x3) bulunur.
Bu regresyon denklemini istatistiksel gösterimle yazarsak şöyle görünecektir:
y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3
Örnek 3: Tilde operatörünü bilinmeyen sayıda tahmin değişkeniyle kullanma
R’ye aşağıdaki çoklu doğrusal regresyon modelini uyduğumuzu varsayalım:
model <- lm(y ~ ., data=df)
Bu özel sözdizimi, y’yi yanıt değişkeni olarak ve veri çerçevesindeki diğer tüm değişkenleri yordayıcı değişkenler olarak kullanmak istediğimizi gösterir.
Bu sözdizimi, bir regresyon modelini tonlarca öngörücü değişkenle eşleştirmek istediğimizde kullanışlıdır, ancak her yordayıcı değişkenin ayrı ayrı adını girmek istemiyoruz.
Ek kaynaklar
Aşağıdaki eğitimlerde R’deki diğer yaygın işlevlerin nasıl kullanılacağı açıklanmaktadır:
R’de dolar işareti operatörü ($) nasıl kullanılır?
R’de “NOT IN” operatörü nasıl kullanılır?
R’de %in% operatörü nasıl kullanılır?