كيفية حساب الارتباط بين عمودين في الباندا
يمكنك استخدام بناء الجملة التالي لحساب الارتباط بين عمودين في pandas DataFrame:
df[' column1 ']. corr (df[' column2 '])
توضح الأمثلة التالية كيفية استخدام بناء الجملة هذا عمليًا.
مثال 1: حساب الارتباط بين عمودين
يوضح الكود التالي كيفية حساب الارتباط بين الأعمدة في pandas DataFrame:
import pandas as pd #createDataFrame df = pd. DataFrame ({' points ': [25, 12, 15, 14, 19, 23, 25, 29], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #view first five rows of DataFrame df. head () points assists rebounds 0 25 5 11 1 12 7 8 2 15 7 10 3 14 9 6 4 19 12 6 #calculate correlation between points and assists df[' points ']. corr (df[' assists ']) -0.359384
معامل الارتباط هو -0.359 . وبما أن هذا الارتباط سلبي، فإن هذا يخبرنا أن النقاط والتمريرات الحاسمة مرتبطة بشكل سلبي.
بمعنى آخر، مع زيادة القيم الموجودة في عمود النقاط، تميل القيم الموجودة في عمود المساعدة إلى الانخفاض.
المثال 2: حساب أهمية الارتباط
لتحديد ما إذا كان معامل الارتباط ذو دلالة إحصائية أم لا، يمكنك استخدام الدالة pearsonr(x, y) من مكتبة SciPy .
يوضح الكود التالي كيفية استخدام هذه الوظيفة عمليًا:
import pandas as pd from scipy. stats import pearsonr #createDataFrame df = pd. DataFrame ({' points ': [25, 12, 15, 14, 19, 23, 25, 29], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #calculate p-value of correlation coefficient between points and assists pearsonr(df[' points '], df[' assists ']) (-0.359384, 0.38192)
تعرض القيمة الأولى للمخرجات معامل الارتباط (-0.359384) وتعرض القيمة الثانية القيمة p (0.38192) المرتبطة بمعامل الارتباط هذا.
وبما أن القيمة p لا تقل عن α = 0.05، فإننا نستنتج أن الارتباط بين النقاط والمساعدات ليس ذا دلالة إحصائية.
مصادر إضافية
كيفية حساب ارتباط رتبة سبيرمان في بايثون
كيفية حساب الارتباط الجزئي في بايثون
كيفية حساب الارتباط المتبادل في بايثون