كيفية حساب الارتباط بين عمودين في الباندا


يمكنك استخدام بناء الجملة التالي لحساب الارتباط بين عمودين في pandas DataFrame:

 df[' column1 ']. corr (df[' column2 '])

توضح الأمثلة التالية كيفية استخدام بناء الجملة هذا عمليًا.

مثال 1: حساب الارتباط بين عمودين

يوضح الكود التالي كيفية حساب الارتباط بين الأعمدة في pandas DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' points ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view first five rows of DataFrame
df. head ()

        points assists rebounds
0 25 5 11
1 12 7 8
2 15 7 10
3 14 9 6
4 19 12 6

#calculate correlation between points and assists
df[' points ']. corr (df[' assists '])

-0.359384

معامل الارتباط هو -0.359 . وبما أن هذا الارتباط سلبي، فإن هذا يخبرنا أن النقاط والتمريرات الحاسمة مرتبطة بشكل سلبي.

بمعنى آخر، مع زيادة القيم الموجودة في عمود النقاط، تميل القيم الموجودة في عمود المساعدة إلى الانخفاض.

المثال 2: حساب أهمية الارتباط

لتحديد ما إذا كان معامل الارتباط ذو دلالة إحصائية أم لا، يمكنك استخدام الدالة pearsonr(x, y) من مكتبة SciPy .

يوضح الكود التالي كيفية استخدام هذه الوظيفة عمليًا:

 import pandas as pd
from scipy. stats import pearsonr

#createDataFrame
df = pd. DataFrame ({' points ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#calculate p-value of correlation coefficient between points and assists
pearsonr(df[' points '], df[' assists '])

(-0.359384, 0.38192)

تعرض القيمة الأولى للمخرجات معامل الارتباط (-0.359384) وتعرض القيمة الثانية القيمة p (0.38192) المرتبطة بمعامل الارتباط هذا.

وبما أن القيمة p لا تقل عن α = 0.05، فإننا نستنتج أن الارتباط بين النقاط والمساعدات ليس ذا دلالة إحصائية.

مصادر إضافية

كيفية حساب ارتباط رتبة سبيرمان في بايثون
كيفية حساب الارتباط الجزئي في بايثون
كيفية حساب الارتباط المتبادل في بايثون

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *