Korelasyon ve regresyon: fark nedir?


Korelasyon ve regresyon birbiriyle ilişkili ancak tamamen aynı olmayan iki istatistiksel terimdir.

Bu derste her iki terimin de kısa bir açıklamasını sunacağız ve bunların nasıl benzer ve farklı olduklarını açıklayacağız.

Korelasyon nedir?

Korelasyon , x ve y olmak üzere iki değişken arasındaki doğrusal ilişkiyi ölçer. -1 ile 1 arasında bir değere sahiptir; burada:

  • -1, iki değişken arasında tamamen negatif bir doğrusal korelasyonu gösterir
  • 0, iki değişken arasında doğrusal bir korelasyon olmadığını gösterir
  • 1, iki değişken arasında mükemmel pozitif doğrusal bir korelasyonu gösterir

Örneğin, iki değişkeni içeren aşağıdaki veri setine sahip olduğumuzu varsayalım: (1) Çalışılan saat ve (2) 20 farklı öğrenci için alınan sınav puanları:

Çalışılan saatlere ve sınav sonuçlarına göre bir dağılım grafiği oluştursaydık, şöyle görünürdü:

Sadece grafiğe bakarak, daha fazla çalışan öğrencilerin sınavlarda daha iyi performans gösterme eğiliminde olduklarını görebiliriz. Yani iki değişken arasında pozitif bir ilişkinin olduğunu görsel olarak görebiliyoruz.

Bir hesap makinesi kullanarak bu iki değişken arasındaki korelasyonun r = 0,915 olduğunu görebiliriz. Bu değerin 1’e yakın olması iki değişken arasında pozitif yönde güçlü bir ilişkinin olduğunu doğrulamaktadır.

Regresyon nedir?

Regresyon, x değişkeninin değerlerini değiştirmenin y değişkeninin değerlerini nasıl etkilediğini anlamak için kullanabileceğimiz bir yöntemdir.

Bir regresyon modeli, yordayıcı değişken olarak x değişkenini ve yanıt değişkeni olarak diğer değişken y’yi kullanır. Daha sonra iki değişken arasındaki ilişkiyi en iyi tanımlayan aşağıdaki forma sahip bir denklem bulunur:

ŷ = b 0 + b 1 x

Altın:

  • ŷ: yanıt değişkeninin tahmin edilen değeri
  • b 0 : Başlangıç noktasındaki koordinat (x sıfıra eşit olduğunda y’nin değeri)
  • b 1 : Regresyon katsayısı (x’teki bir birimlik artış için y’deki ortalama artış)
  • x: tahmin değişkeninin değeri

Örneğin, önceki veri kümemizi göz önünde bulundurun:

Doğrusal bir regresyon hesaplayıcısı kullanarak, aşağıdaki denklemin bu iki değişken arasındaki ilişkiyi en iyi şekilde tanımladığını bulduk:

Tahmin edilen sınav puanı = 65,47 + 2,58*(çalışma saati)

Bu denklemi yorumlamanın yolu şudur:

  • Sıfır saat eğitim gören bir öğrencinin tahmini sınav puanı 65,47’dir .
  • Ek bir saatlik çalışmayla ilişkili ortalama sınav puanı artışı 2,58’dir .

Bu denklemi bir öğrencinin çalışılan saat sayısına göre alacağı puanı tahmin etmek için de kullanabiliriz.

Örneğin 6 saat ders çalışan bir öğrencinin notu 80,95 olmalıdır:

Tahmin edilen sınav puanı = 65,47 + 2,58*(6) = 80,95 .

Bu denklemi dağılım grafiğinde bir çizgi olarak da çizebiliriz:

Dağılım grafiğinde korelasyon ve regresyon çizgisi

Regresyon çizgisinin verilere oldukça iyi “uyduğunu” görebiliriz.

Daha önce bu iki değişken arasındaki korelasyonun r = 0,915 olduğunu hatırlayın. Bu değerin karesini alabileceğimiz ve yanıt değişkenindeki yordayıcı değişken tarafından açıklanabilen varyansın toplam oranını tanımlayan “r kare” adı verilen bir sayı elde edebileceğimiz ortaya çıktı.

Bu örnekte r 2 = 0,915 2 = 0,837 . Bu, sınav puanlarındaki değişimin %83,7’sinin çalışılan saat sayısıyla açıklanabileceği anlamına gelir.

Korelasyon ve regresyon: benzerlikler ve farklılıklar

Korelasyon ve regresyon arasındaki benzerliklerin ve farklılıkların bir özeti:

Benzerlikler:

  • Her ikisi de iki değişken arasındaki ilişkinin yönünü ölçer.
  • Her ikisi de iki değişken arasındaki ilişkinin gücünü ölçer.

Farklılıklar:

  • Regresyon iki değişken arasındaki neden-sonuç ilişkisini gösterme yeteneğine sahiptir. Korelasyon bunu yapmaz.
  • Regresyon, başka bir değişkenin değerine bağlı olarak bir değişkenin değerini tahmin etmek için bir denklem kullanabilir. Korelasyon bunu yapmaz.
  • Regresyon, iki değişken arasındaki ilişkiyi ölçmek için bir denklem kullanır. Korelasyon tek bir sayı kullanır.

Ek kaynaklar

Aşağıdaki eğitimlerde bu makalede ele alınan konulara ilişkin daha ayrıntılı açıklamalar sunulmaktadır.

Pearson Korelasyon Katsayısına Giriş
Basit Doğrusal Regresyona Giriş
Basit Doğrusal Regresyon Hesaplayıcısı
İyi bir R-kare değeri nedir?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir