Eğri bir artık grafiğin yorumlanması (örnekle)
Artık grafikleri, bir regresyon modelinin artıklarının normal dağılıp dağılmadığını ve değişen varyans sergileyip sergilemediğini değerlendirmek için kullanılır.
İdeal olarak, artık grafiğindeki noktaların, net bir model olmadan, sıfır değeri etrafında rastgele dağılmasını istersiniz.
Çizim noktalarının kavisli bir desene sahip olduğu bir artık grafikle karşılaşırsanız, bu muhtemelen veriler için belirttiğiniz regresyon modelinin doğru olmadığı anlamına gelir.
Çoğu durumda bu, ikinci dereceden bir eğilimi takip eden bir veri kümesine doğrusal bir regresyon modeli yerleştirmeye çalıştığınız anlamına gelir.
Aşağıdaki örnek, pratikte eğri bir artık grafiğin nasıl yorumlanacağını (ve düzeltileceğini) gösterir.
Örnek: Eğri bir artık grafiğin yorumlanması
Bir ofiste 11 farklı kişi için haftalık çalışılan saat sayısı ve bildirilen mutluluk düzeyi (0’dan 100’e kadar bir ölçekte) hakkında aşağıdaki verileri topladığımızı varsayalım:
Çalışılan saatlere karşı mutluluk düzeyini gösteren basit bir dağılım grafiği oluştursaydık, şöyle görünürdü:
Şimdi, mutluluk düzeylerini tahmin etmek için çalışılan saatleri kullanarak bir regresyon modeli oluşturmak istediğimizi varsayalım.
Aşağıdaki kod, basit bir doğrusal regresyon modelinin bu veri kümesine nasıl sığdırılacağını ve R’de artık grafiğin nasıl oluşturulacağını gösterir:
#create dataframe
df <- data. frame (hours=c(6, 9, 12, 14, 30, 35, 40, 47, 51, 55, 60),
happiness=c(14, 28, 50, 70, 89, 94, 90, 75, 59, 44, 27))
#fit linear regression model
linear_model <- lm(happiness ~ hours, data=df)
#get list of residuals
res <- resid(linear_model)
#produce residual vs. fitted plot
plot(fitted(linear_model), res, xlab=' Fitted Values ', ylab=' Residuals ')
#add a horizontal line at 0
abline(0,0)
X ekseni takılan değerleri, y ekseni ise artıkları görüntüler.
Grafikten artıklarda kavisli bir modelin olduğunu görebiliyoruz, bu da doğrusal regresyon modelinin bu veri setine uygun bir uyum sağlamadığını gösteriyor.
Aşağıdaki kod, ikinci dereceden bir regresyon modelinin bu veri kümesine nasıl sığdırılacağını ve R’de bir artık grafiğinin nasıl oluşturulacağını gösterir:
#create dataframe
df <- data. frame (hours=c(6, 9, 12, 14, 30, 35, 40, 47, 51, 55, 60),
happiness=c(14, 28, 50, 70, 89, 94, 90, 75, 59, 44, 27))
#define quadratic term to use in model
df$hours2 <- df$hours^2
#fit quadratic regression model
quadratic_model <- lm(happiness ~ hours + hours2, data=df)
#get list of residuals
res <- resid(quadratic_model)
#produce residual vs. fitted plot
plot(fitted(quadratic_model), res, xlab=' Fitted Values ', ylab=' Residuals ')
#add a horizontal line at 0
abline(0,0)
Bir kez daha x ekseni uygun değerleri, y ekseni ise artıkları gösterir.
Grafikten artıkların sıfır etrafında rastgele dağıldığını ve artıklarda net bir trendin olmadığını görebiliriz.
Bu bize, ikinci dereceden bir regresyon modelinin, bu veri setini uydurma konusunda doğrusal bir regresyon modelinden çok daha iyi bir iş çıkardığını söyler.
Çalışılan saat ile mutluluk düzeyleri arasındaki gerçek ilişkinin doğrusal değil ikinci dereceden olduğunu gördüğümüz göz önüne alındığında, bu mantıklı olmalıdır.
Ek kaynaklar
Aşağıdaki eğitimlerde farklı istatistiksel yazılımlar kullanılarak artık grafiklerin nasıl oluşturulacağı açıklanmaktadır:
Elle Artık Yol Nasıl Oluşturulur
R’de artık arsa nasıl oluşturulur
Excel’de Artık Grafik Nasıl Oluşturulur
Python’da Artık Arsa Nasıl Oluşturulur