Regresyon analizinde artıklar nasıl hesaplanır?


Basit doğrusal regresyon, iki değişken (x ve y) arasındaki ilişkiyi anlamak için kullanabileceğiniz istatistiksel bir yöntemdir.

X değişkenine yordayıcı değişken adı verilir. Diğer değişken, y , yanıt değişkeni olarak bilinir.

Örneğin, yedi kişinin ağırlığını ve boyunu içeren aşağıdaki veri setine sahip olduğumuzu varsayalım:

Basit doğrusal regresyon

Ağırlık belirleyici değişken olsun ve boy da yanıt değişkeni olsun.

Bu iki değişkeni bir dağılım grafiği kullanarak, x ekseninde ağırlık ve y ekseninde yükseklik olacak şekilde grafiklendirirsek , şöyle görünecektir:

Dağılım grafiğinden, ağırlık arttıkça boyun da artma eğiliminde olduğunu açıkça görebiliriz, ancak ağırlık ile boy arasındaki bu ilişkiyi gerçekte ölçmek için doğrusal regresyon kullanmamız gerekir.

Doğrusal regresyon kullanarak verilerimize en iyi “uyan” çizgiyi bulabiliriz:

Bu en iyi uyum çizgisinin formülü şöyle yazılmıştır:

ŷ = b 0 + b 1 x

burada ŷ yanıt değişkeninin tahmin edilen değeridir, b 0 kesişme noktasıdır, b 1 regresyon katsayısıdır ve x yordayıcı değişkenin değeridir.

Bu örnekte en uygun çizgi şu şekildedir:

boyut = 32,783 + 0,2001*(ağırlık)

Artıklar nasıl hesaplanır

Dağılım grafiğimizdeki veri noktalarının her zaman en iyi uyum çizgisine tam olarak karşılık gelmediğini unutmayın:

Veri noktası ile çizgi arasındaki bu farka artık denir. Her veri noktası için, o noktanın kalıntısını, gerçek değeri ile en uygun çizgiden tahmin edilen değer arasındaki farkı alarak hesaplayabiliriz.

Örnek 1: Artığın hesaplanması

Örneğin veri setimizdeki yedi kişinin kilosunu ve boyunu hatırlayın:

Basit doğrusal regresyon

İlk birey 140 kilo ağırlığında. ve 60 inç yüksekliğinde.

Bu bireyin beklenen boyunu bulmak için, ağırlığını en uygun denklem doğrusuna yerleştirebiliriz:

boyut = 32,783 + 0,2001*(ağırlık)

Dolayısıyla bu bireyin tahmini büyüklüğü:

yükseklik = 32,783 + 0,2001*(140)

yükseklik = 60,797 inç

Dolayısıyla bu veri noktası için kalan değer 60 – 60,797 = -0,797’dir .

Örnek 2: Artığın hesaplanması

Her bir veri noktasına ilişkin artığı hesaplamak için yukarıda kullanılan sürecin aynısını kullanabiliriz. Örneğin veri setimizdeki ikinci bireye ait artığı hesaplayalım:

Basit doğrusal regresyon

İkinci birey ise 155 kilo ağırlığında. ve 62 inç yüksekliğinde.

Bu bireyin beklenen boyunu bulmak için, ağırlığını en uygun denklem doğrusuna yerleştirebiliriz:

boyut = 32,783 + 0,2001*(ağırlık)

Dolayısıyla bu bireyin tahmini büyüklüğü:

yükseklik = 32,783 + 0,2001*(155)

yükseklik = 63,7985 inç

Yani bu veri noktası için kalan değer 62 – 63,7985 = -1,7985’tir .

Tüm artıkları hesapla

Önceki iki örnekle aynı yöntemi kullanarak her veri noktası için artıkları hesaplayabiliriz:

Bazı artıkların pozitif, bazılarının ise negatif olduğuna dikkat edin. Tüm artıkları toplarsak toplamı sıfır olur.

Bunun nedeni, doğrusal regresyonun, artıkların toplam karesini en aza indiren çizgiyi bulması ve bu nedenle çizginin, bazı veri noktaları çizginin üstünde ve diğerleri çizginin altında yer alacak şekilde verilerden mükemmel bir şekilde geçmesidir.

Kalıntıları görüntüle

Kalıntının , verinin gerçek değeri ile en uygun regresyon çizgisi tarafından tahmin edilen değer arasındaki mesafe olduğunu unutmayın. Bu mesafeler bir nokta bulutu üzerinde görsel olarak şöyle görünür:

Bazı artıkların diğerlerinden daha büyük olduğuna dikkat edin. Ayrıca daha önce de belirttiğimiz gibi bazı artıklar pozitif, bazıları ise negatiftir.

Artık yol oluşturma

Artıkları hesaplamanın amacı, regresyon çizgisinin verilere ne kadar iyi uyduğunu görmektir.

Daha büyük artıklar, regresyon çizgisinin verilere iyi uymadığını, yani gerçek veri noktalarının regresyon çizgisine yaklaşmadığını gösterir.

Daha küçük artıklar, regresyon çizgisinin verilere daha iyi uyduğunu, yani gerçek veri noktalarının regresyon çizgisine daha yakın olduğunu gösterir.

Tüm artıkları aynı anda görselleştirmek için kullanışlı bir grafik türü, artık grafiğidir. Artık grafiği, bir regresyon modeli için artıklara karşı tahmin edilen değerleri görüntüleyen bir çizim türüdür.

Bu tür grafik genellikle doğrusal bir regresyon modelinin belirli bir veri seti için uygun olup olmadığını değerlendirmek ve artıkların değişen varyanslılığını kontrol etmek için kullanılır .

Excel’de basit bir doğrusal regresyon modeli için artık grafiğin nasıl oluşturulacağını öğrenmek üzere bu eğitime göz atın.

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir