Python'da korelasyon matrisi nasıl oluşturulur
İki değişken arasındaki ilişkiyi ölçmenin bir yolu, iki değişken arasındaki doğrusal ilişkinin bir ölçüsü olan Pearson korelasyon katsayısını kullanmaktır .
-1 ile 1 arasında bir değer alır; burada:
- -1 tamamen negatif bir doğrusal korelasyonu gösterir.
- 0 doğrusal bir korelasyon olmadığını gösterir.
- 1 mükemmel pozitif doğrusal korelasyonu gösterir.
Korelasyon katsayısı sıfırdan ne kadar uzaksa, iki değişken arasındaki ilişki o kadar güçlüdür.
Ancak bazı durumlarda birden fazla değişken çifti arasındaki korelasyonu anlamak isteriz. Bu durumlarda, değişkenlerin çeşitli ikili kombinasyonları arasındaki korelasyon katsayılarını gösteren kare bir tablo olan birkorelasyon matrisi oluşturabiliriz.
Bu eğitimde Python’da bir korelasyon matrisinin nasıl oluşturulacağı ve yorumlanacağı açıklanmaktadır.
Python’da Korelasyon Matrisi Nasıl Oluşturulur
Python’da bir korelasyon matrisi oluşturmak için aşağıdaki adımları kullanın.
Adım 1: Veri kümesini oluşturun.
import pandas as pd data = {'assists': [4, 5, 5, 6, 7, 8, 8, 10], 'rebounds': [12, 14, 13, 7, 8, 8, 9, 13], 'points': [22, 24, 26, 26, 29, 32, 20, 14] } df = pd. DataFrame (data, columns=['assists','rebounds','points']) df assist rebound points 0 4 12 22 1 5 14 24 2 5 13 26 3 6 7 26 4 7 8 29 5 8 8 32 6 8 9 20 7 10 13 14
Adım 2: Korelasyon matrisini oluşturun.
#create correlation matrix df. corr () assists rebound points assists 1.000000 -0.244861 -0.329573 rebounds -0.244861 1.000000 -0.522092 points -0.329573 -0.522092 1.000000 #create same correlation matrix with coefficients rounded to 3 decimals df. corr (). round (3) assists rebound points assists 1.000 -0.245 -0.330 rebounds -0.245 1.000 -0.522 points -0.330 -0.522 1.000
Adım 3: Korelasyon matrisini yorumlayın.
Tablonun köşegeni boyunca korelasyon katsayılarının tümü 1’e eşittir çünkü her değişken kendisiyle mükemmel bir korelasyona sahiptir.
Diğer tüm korelasyon katsayıları, değişkenlerin farklı ikili kombinasyonları arasındaki korelasyonu gösterir. Örneğin:
- Asistler ve ribaundlar arasındaki korelasyon katsayısı -0,245’tir .
- Asistlerle sayılar arasındaki korelasyon katsayısı -0,330 .
- Ribaundlarla sayılar arasındaki korelasyon katsayısı -0,522’dir .
Adım 4: Korelasyon matrisini görselleştirin (isteğe bağlı).
Pandalarda bulunan stil seçeneklerini kullanarak korelasyon matrisini görselleştirebilirsiniz:
corr = df. corr () corr. style . background_gradient (cmap='coolwarm')
Farklı renklere sahip bir korelasyon matrisi oluşturmak için cmap bağımsız değişkenini de değiştirebilirsiniz.
corr = df. corr () corr. style . background_gradient (cmap=' RdYlGn ')
corr = df. corr () corr. style . background_gradient (cmap=' bwr ')
corr = df. corr () corr. style . background_gradient (cmap=' PuOr ')
Not : Cmap argümanlarının tam listesi için matplotlib belgelerine bakın.