كيفية إنشاء مصفوفة الارتباط في بايثون
إحدى الطرق لقياس العلاقة بين متغيرين هي استخدام معامل ارتباط بيرسون ، وهو مقياس للارتباط الخطي بين متغيرين .
يأخذ قيمة بين -1 و 1 حيث:
- -1 يشير إلى وجود علاقة خطية سلبية تماما.
- 0 يشير إلى عدم وجود علاقة خطية.
- 1 يشير إلى وجود علاقة خطية إيجابية تماما.
وكلما زاد معامل الارتباط عن الصفر، كلما كانت العلاقة بين المتغيرين أقوى.
لكن في بعض الحالات، نريد أن نفهم العلاقة بين أزواج متعددة من المتغيرات. في هذه الحالات، يمكننا إنشاء مصفوفة ارتباط ، وهي عبارة عن جدول مربع يوضح معاملات الارتباط بين عدة مجموعات زوجية من المتغيرات.
يشرح هذا البرنامج التعليمي كيفية إنشاء وتفسير مصفوفة الارتباط في بايثون.
كيفية إنشاء مصفوفة الارتباط في بايثون
استخدم الخطوات التالية لإنشاء مصفوفة الارتباط في بايثون.
الخطوة 1: إنشاء مجموعة البيانات.
import pandas as pd data = {'assists': [4, 5, 5, 6, 7, 8, 8, 10], 'rebounds': [12, 14, 13, 7, 8, 8, 9, 13], 'points': [22, 24, 26, 26, 29, 32, 20, 14] } df = pd. DataFrame (data, columns=['assists','rebounds','points']) df assist rebound points 0 4 12 22 1 5 14 24 2 5 13 26 3 6 7 26 4 7 8 29 5 8 8 32 6 8 9 20 7 10 13 14
الخطوة 2: إنشاء مصفوفة الارتباط.
#create correlation matrix df. corr () assists rebound points assists 1.000000 -0.244861 -0.329573 rebounds -0.244861 1.000000 -0.522092 points -0.329573 -0.522092 1.000000 #create same correlation matrix with coefficients rounded to 3 decimals df. corr (). round (3) assists rebound points assists 1.000 -0.245 -0.330 rebounds -0.245 1.000 -0.522 points -0.330 -0.522 1.000
الخطوة 3: تفسير مصفوفة الارتباط.
معاملات الارتباط على طول قطر الجدول تساوي 1 لأن كل متغير يرتبط تمامًا بنفسه.
تشير جميع معاملات الارتباط الأخرى إلى الارتباط بين مجموعات مختلفة من المتغيرات الزوجية. على سبيل المثال:
- معامل الارتباط بين التمريرات الحاسمة والمرتدات هو -0.245 .
- معامل الارتباط بين التمريرات الحاسمة والنقاط هو -0.330 .
- معامل الارتباط بين المرتدات والنقاط هو -0.522 .
الخطوة 4: تصور مصفوفة الارتباط (اختياري).
يمكنك تصور مصفوفة الارتباط باستخدام خيارات التصميم المتوفرة في الباندا:
corr = df. corr () corr. style . background_gradient (cmap='coolwarm')
يمكنك أيضًا تعديل الوسيطة cmap لإنتاج مصفوفة ارتباط بألوان مختلفة.
corr = df. corr () corr. style . background_gradient (cmap=' RdYlGn ')
corr = df. corr () corr. style . background_gradient (cmap=' bwr ')
corr = df. corr () corr. style . background_gradient (cmap=' PuOr ')
ملاحظة : للحصول على قائمة كاملة بوسائط cmap ، راجع وثائق matplotlib .