Python'da kovaryans matrisi nasıl oluşturulur
Kovaryans , bir değişkendeki değişikliklerin ikinci bir değişkendeki değişikliklerle nasıl ilişkilendirildiğinin bir ölçüsüdür. Daha spesifik olarak, iki değişkenin doğrusal olarak ilişkili olma derecesinin bir ölçüsüdür.
Kovaryans matrisi, birçok farklı değişken arasındaki kovaryansı gösteren bir kare matristir. Bu, bir veri kümesinde farklı değişkenlerin nasıl ilişkili olduğunu anlamanın yararlı bir yolu olabilir.
Aşağıdaki örnek Python’da bir kovaryans matrisinin nasıl oluşturulacağını gösterir.
Python’da Kovaryans Matrisi Nasıl Oluşturulur
Python’da bir kovaryans matrisi oluşturmak için aşağıdaki adımları kullanın.
Adım 1: Veri kümesini oluşturun.
İlk olarak, 10 farklı öğrencinin üç dersteki (matematik, fen bilimleri ve tarih) test puanlarını içeren bir veri seti oluşturacağız.
import numpy as np math = [84, 82, 81, 89, 73, 94, 92, 70, 88, 95] science = [85, 82, 72, 77, 75, 89, 95, 84, 77, 94] history = [97, 94, 93, 95, 88, 82, 78, 84, 69, 78] data = np.array([math, science, history])
Adım 2: Kovaryans matrisini oluşturun.
Daha sonra, popülasyon kovaryans matrisini hesaplayabilmemiz için önyargı = True değerini belirterek numpy cov() işlevini kullanarak bu veri kümesi için kovaryans matrisini oluşturacağız.
np.cov(data, bias= True )
array([[ 64.96, 33.2, -24.44],
[33.2, 56.4, -24.1],
[-24.44, -24.1, 75.56]])
Adım 3: Kovaryans matrisini yorumlayın.
Matrisin köşegenleri boyunca yer alan değerler, her bir konunun basitçe varyanslarıdır. Örneğin:
- Matematik puanlarının varyansı 64,96
- Fen puanlarının varyansı 56,4
- Geçmiş puan farkı 75,56
Matrisin diğer değerleri farklı konular arasındaki kovaryansları temsil eder. Örneğin:
- Matematik ve fen bilimleri puanları arasındaki kovaryans 33,2’dir.
- Matematik ve tarih puanları arasındaki kovaryans -24,44’tür.
- Fen ve tarih puanları arasındaki kovaryans -24,1’dir.
Kovaryans için pozitif bir sayı, iki değişkenin art arda artma veya azalma eğiliminde olduğunu gösterir. Örneğin matematik ve fen bilimleri arasında pozitif bir kovaryans (33.2) vardır; bu da matematikte yüksek puan alan öğrencilerin fen bilimlerinde de yüksek puan alma eğiliminde olduğunu gösterir. Tersine, matematikte zayıf performans gösteren öğrenciler fen alanında da düşük performans gösterme eğilimindedir.
Kovaryans için negatif bir sayı, bir değişken artarken ikinci bir değişkenin azalma eğiliminde olduğunu gösterir. Örneğin, matematik ve tarihin negatif bir kovaryansı (-24,44) vardır, bu da matematikte yüksek puan alan öğrencilerin tarihte düşük puan alma eğiliminde olduğunu gösterir. Tersine, matematikte düşük puan alan öğrenciler tarihte yüksek puan alma eğilimindedir.
Adım 4: Kovaryans matrisini görselleştirin (isteğe bağlı).
Seaborn paketinin heatmap() fonksiyonunu kullanarak kovaryans matrisini görselleştirebilirsiniz:
import seaborn as sns import matplotlib.pyplot as plt cov = np.cov(data, bias=True) labs = ['math', 'science', 'history'] sns.heatmap(cov, annot=True, fmt='g', xticklabels=labs, yticklabels=labs) plt.show()
Cmap bağımsız değişkenini belirterek renk paletini de değiştirebilirsiniz:
sns.heatmap(cov, annot=True, fmt='g', xticklabels=labs, yticklabels=labs, cmap=' YlGnBu ')
plt.show()
Bu ısı haritasının nasıl şekillendirileceğine ilişkin daha fazla ayrıntı için deniz doğuşu belgelerine bakın.