Pandas'ta iki sütun arasındaki korelasyon nasıl hesaplanır?
Bir pandas DataFrame’deki iki sütun arasındaki korelasyonu hesaplamak için aşağıdaki sözdizimini kullanabilirsiniz:
df[' column1 ']. corr (df[' column2 '])
Aşağıdaki örnekler bu sözdiziminin pratikte nasıl kullanılacağını göstermektedir.
Örnek 1: İki sütun arasındaki korelasyonu hesaplayın
Aşağıdaki kod, bir pandas DataFrame’deki sütunlar arasındaki korelasyonun nasıl hesaplanacağını gösterir:
import pandas as pd #createDataFrame df = pd. DataFrame ({' points ': [25, 12, 15, 14, 19, 23, 25, 29], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #view first five rows of DataFrame df. head () points assists rebounds 0 25 5 11 1 12 7 8 2 15 7 10 3 14 9 6 4 19 12 6 #calculate correlation between points and assists df[' points ']. corr (df[' assists ']) -0.359384
Korelasyon katsayısı -0,359’dur . Bu korelasyon negatif olduğundan, bu bize sayı ve asistlerin negatif korelasyona sahip olduğunu gösteriyor.
Yani puan sütunundaki değerler arttıkça asist sütunundaki değerler düşme eğilimi gösteriyor.
Örnek 2: Korelasyonun Önemini Hesaplayın
Bir korelasyon katsayısının istatistiksel olarak anlamlı olup olmadığını belirlemek için SciPy kütüphanesindeki pearsonr(x, y) fonksiyonunu kullanabilirsiniz.
Aşağıdaki kod bu işlevin pratikte nasıl kullanılacağını gösterir:
import pandas as pd from scipy. stats import pearsonr #createDataFrame df = pd. DataFrame ({' points ': [25, 12, 15, 14, 19, 23, 25, 29], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #calculate p-value of correlation coefficient between points and assists pearsonr(df[' points '], df[' assists ']) (-0.359384, 0.38192)
Çıktının ilk değeri korelasyon katsayısını (-0,359384) görüntüler ve ikinci değer, bu korelasyon katsayısıyla ilişkili p değerini (0,38192) görüntüler.
P değeri α = 0,05’ten küçük olmadığından, puanlar ve asistler arasındaki korelasyonun istatistiksel olarak anlamlı olmadığı sonucuna varabiliriz.
Ek kaynaklar
Python’da Spearman Sıra Korelasyonu Nasıl Hesaplanır?
Python’da kısmi korelasyon nasıl hesaplanır
Python’da Çapraz Korelasyon Nasıl Hesaplanır?