Python'da korelasyon matrisi nasıl oluşturulur


İki değişken arasındaki ilişkiyi ölçmenin bir yolu, iki değişken arasındaki doğrusal ilişkinin bir ölçüsü olan Pearson korelasyon katsayısını kullanmaktır .

-1 ile 1 arasında bir değer alır; burada:

  • -1 tamamen negatif bir doğrusal korelasyonu gösterir.
  • 0 doğrusal bir korelasyon olmadığını gösterir.
  • 1 mükemmel pozitif doğrusal korelasyonu gösterir.

Korelasyon katsayısı sıfırdan ne kadar uzaksa, iki değişken arasındaki ilişki o kadar güçlüdür.

Ancak bazı durumlarda birden fazla değişken çifti arasındaki korelasyonu anlamak isteriz. Bu durumlarda, değişkenlerin çeşitli ikili kombinasyonları arasındaki korelasyon katsayılarını gösteren kare bir tablo olan birkorelasyon matrisi oluşturabiliriz.

Bu eğitimde Python’da bir korelasyon matrisinin nasıl oluşturulacağı ve yorumlanacağı açıklanmaktadır.

Python’da Korelasyon Matrisi Nasıl Oluşturulur

Python’da bir korelasyon matrisi oluşturmak için aşağıdaki adımları kullanın.

Adım 1: Veri kümesini oluşturun.

 import pandas as pd

data = {'assists': [4, 5, 5, 6, 7, 8, 8, 10],
        'rebounds': [12, 14, 13, 7, 8, 8, 9, 13],
        'points': [22, 24, 26, 26, 29, 32, 20, 14]
        }

df = pd. DataFrame (data, columns=['assists','rebounds','points'])
df

   assist rebound points
0 4 12 22
1 5 14 24
2 5 13 26
3 6 7 26
4 7 8 29
5 8 8 32
6 8 9 20
7 10 13 14

Adım 2: Korelasyon matrisini oluşturun.

 #create correlation matrix
df. corr ()

                assists rebound points
assists 1.000000 -0.244861 -0.329573
rebounds -0.244861 1.000000 -0.522092
points -0.329573 -0.522092 1.000000

#create same correlation matrix with coefficients rounded to 3 decimals 
df. corr (). round (3)
	       assists rebound points
assists 1.000 -0.245 -0.330
rebounds -0.245 1.000 -0.522
points -0.330 -0.522 1.000

Adım 3: Korelasyon matrisini yorumlayın.

Tablonun köşegeni boyunca korelasyon katsayılarının tümü 1’e eşittir çünkü her değişken kendisiyle mükemmel bir korelasyona sahiptir.

Diğer tüm korelasyon katsayıları, değişkenlerin farklı ikili kombinasyonları arasındaki korelasyonu gösterir. Örneğin:

  • Asistler ve ribaundlar arasındaki korelasyon katsayısı -0,245’tir .
  • Asistlerle sayılar arasındaki korelasyon katsayısı -0,330 .
  • Ribaundlarla sayılar arasındaki korelasyon katsayısı -0,522’dir .

Adım 4: Korelasyon matrisini görselleştirin (isteğe bağlı).

Pandalarda bulunan stil seçeneklerini kullanarak korelasyon matrisini görselleştirebilirsiniz:

 corr = df. corr ()
corr. style . background_gradient (cmap='coolwarm')

Python'da Korelasyon Matrisi

Farklı renklere sahip bir korelasyon matrisi oluşturmak için cmap bağımsız değişkenini de değiştirebilirsiniz.

 corr = df. corr ()
corr. style . background_gradient (cmap=' RdYlGn ') 

Python'da matplotlib ile korelasyon matrisi

 corr = df. corr ()
corr. style . background_gradient (cmap=' bwr ') 

Pandaları kullanan korelasyon matrisi

 corr = df. corr ()
corr. style . background_gradient (cmap=' PuOr ') 

Python'da Korelasyon Matrisi Örneği

Not : Cmap argümanlarının tam listesi için matplotlib belgelerine bakın.

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir