Excel'de kukla değişkenler nasıl oluşturulur (adım adım)
Kukla değişken, kategorik bir değişkeni iki değerden birini alan sayısal bir değişken olarak temsil edebilmemiz için regresyon analizinde oluşturduğumuz bir değişken türüdür: sıfır veya bir.
Örneğin, aşağıdaki veri setine sahip olduğumuzu ve geliri tahmin etmek için yaş ve medeni durumu kullanmak istediğimizi varsayalım:
Medeni durumu bir regresyon modelinde yordayıcı değişken olarak kullanmak için onu kukla değişkene dönüştürmemiz gerekir.
Bu şu anda üç farklı değer alabilen kategorik bir değişken olduğundan (“Bekar”, “Evli” veya “Boşanmış”) k -1 = 3-1 = 2 kukla değişken oluşturmamız gerekiyor.
Bu kukla değişkeni oluşturmak için, en sık göründüğü için temel değer olarak “Tek” değerini bırakabiliriz. Medeni durumu şu şekilde kukla değişkenlere dönüştürebiliriz:
Bu eğitimde, Excel’de bu kesin veri kümesi için kukla değişkenlerin nasıl oluşturulacağına ve ardından bu kukla değişkenleri tahmin edici olarak kullanarak regresyon analizinin nasıl gerçekleştirileceğine ilişkin adım adım bir örnek sunulmaktadır.
1. Adım: Verileri oluşturun
Öncelikle Excel’de veri kümesini oluşturalım:
Adım 2: Kukla Değişkenleri Oluşturun
Daha sonra, A ve B sütunlarındaki değerleri E ve F sütunlarına kopyalayabilir, ardından Excel’deki IF() işlevini kullanarak iki yeni kukla değişken tanımlayabiliriz: Evli ve Boşanmış.
G2 hücresinde kullandığımız ve G sütunundaki diğer hücrelere kopyaladığımız formül şu şekildedir:
= IF (C2 = "Married", 1, 0)
Ve işte H2 hücresinde kullandığımız ve H sütunundaki diğer hücrelere kopyaladığımız formül:
= IF (C2 = "Divorced", 1, 0)
Daha sonra geliri tahmin etmek için bu kukla değişkenleri bir regresyon modelinde kullanabiliriz.
Adım 3: Doğrusal Regresyon Gerçekleştirin
Çoklu doğrusal regresyon gerçekleştirmek için üst şeritteki Veri sekmesine ve ardından Analiz bölümünde Veri Analizi’ne tıklamamız gerekir:
Bu seçenek kullanılamıyorsa öncelikle Analiz Araç Paketi’ni yüklemelisiniz.
Görüntülenen pencerede Regresyon’a ve ardından Tamam’a tıklayın.
Daha sonra aşağıdaki bilgileri doldurun ve Tamam’a tıklayın.
Bu, aşağıdaki sonucu üretir:
Sonuçtan uygun regresyon çizgisinin şöyle olduğunu görebiliriz:
Gelir = 14.276,12 + 1.471,67*(yaş) + 2.479,75*(evli) – 8.397,40*(boşanmış)
Bir bireyin yaşına ve medeni durumuna göre tahmini gelirini bulmak için bu denklemi kullanabiliriz. Örneğin, 35 yaşında ve evli bir kişinin tahmini geliri 68.264 ABD Doları olacaktır:
Gelir = 14.276,12 + 1.471,67*(35) + 2.479,75*(1) – 8.397,40*(0) = 68.264 ABD doları
Tablodaki regresyon katsayılarını şu şekilde yorumlayabilirsiniz:
- Kesişme: Kesişme, sıfır yaşındaki tek bir kişinin ortalama gelirini temsil eder. Bir birey sıfır yaşında olamayacağından bu özel regresyon modelinde kesişmeyi tek başına yorumlamak mantıklı değildir.
- Yaş: Yaştaki her yıl artış, gelirde ortalama 1.471,67 dolarlık bir artışla ilişkilidir. P değeri (0,004) 0,05’ten küçük olduğundan yaş, gelirin istatistiksel olarak anlamlı bir göstergesidir.
- Evli: Evli bir kişi, bekar bir kişiden ortalama 2.479,75 dolar daha fazla kazanıyor. P değeri (0,800) 0,05’ten küçük olmadığından bu fark istatistiksel olarak anlamlı değildir.
- Boşanmış: Boşanmış bir kişi, bekar bir kişiden ortalama 8.397,40 dolar daha az kazanıyor. P değeri (0,532) 0,05’ten küçük olmadığından bu fark istatistiksel olarak anlamlı değildir.
Her iki kukla değişken de istatistiksel olarak anlamlı olmadığından, gelire öngörücü bir değer katmadığı için medeni durumu bir yordayıcı olarak modelden çıkarabilirdik.
Ek kaynaklar
Excel’de basit doğrusal regresyon nasıl gerçekleştirilir
Excel’de Artık Kareler Toplamı Nasıl Hesaplanır
Excel’de Polinom Regresyon Nasıl Gerçekleştirilir
Excel’de Artık Grafik Nasıl Oluşturulur