كيفية إنشاء مصفوفة الارتباط في r (4 أمثلة)
مصفوفة الارتباط عبارة عن جدول مربع يوضح معاملات الارتباط بين المتغيرات في مجموعة البيانات.
فهو يوفر طريقة سريعة لفهم قوة العلاقات الخطية الموجودة بين المتغيرات في مجموعة البيانات.
هناك أربع طرق شائعة لإنشاء مصفوفة الارتباط في R:
الطريقة الأولى: الدالة الأساسية (للحصول على مصفوفة بسيطة لمعاملات الارتباط)
cor(df)
الطريقة الثانية: دالة rcorr (للحصول على القيم p لمعاملات الارتباط)
library (Hmisc)
rcorr( as.matrix (df))
الطريقة الثالثة: وظيفة corrplot (لتصور مصفوفة الارتباط)
library (corplot)
corrplot(cor(df))
الطريقة الرابعة: وظيفة ggcorrplot (لتصور مصفوفة الارتباط)
library (ggcorrplot)
ggcorrplot(cor(df))
توضح الأمثلة التالية كيفية استخدام كل طريقة مع إطار البيانات التالي في R:
#create data frame
df <- data. frame (assists=c(4, 5, 5, 6, 7, 8, 8, 10),
rebounds=c(12, 14, 13, 7, 8, 8, 9, 13),
points=c(22, 24, 26, 26, 29, 32, 20, 14))
#view data frame
df
assists rebound points
1 4 12 22
2 5 14 24
3 5 13 26
4 6 7 26
5 7 8 29
6 8 8 32
7 8 9 20
8 10 13 14
مثال 1: الدالة الأساسية
يمكننا استخدام الدالة R base cor() لإنشاء مصفوفة ارتباط توضح معاملات الارتباط بين كل متغير في إطار البيانات الخاص بنا:
#create correlation matrix
cor(df)
assists rebound points
assists 1.0000000 -0.2448608 -0.3295730
rebounds -0.2448608 1.0000000 -0.5220917
points -0.3295730 -0.5220917 1.0000000
معاملات الارتباط على طول قطر الجدول تساوي 1 لأن كل متغير يرتبط تمامًا بنفسه.
تشير جميع معاملات الارتباط الأخرى إلى الارتباط بين مجموعات مختلفة من المتغيرات الزوجية. على سبيل المثال:
- معامل الارتباط بين التمريرات الحاسمة والمرتدات هو -0.245 .
- معامل الارتباط بين التمريرات الحاسمة والنقاط هو -0.330 .
- معامل الارتباط بين المرتدات والنقاط هو -0.522 .
مثال 2: الدالة rcorr
يمكننا استخدام الدالة rcorr() من حزمة Hmisc في R لإنشاء مصفوفة ارتباط توضح معاملات الارتباط بين كل متغير في إطار البيانات الخاص بنا:
library (Hmisc)
#create matrix of correlation coefficients and p-values
rcorr( as.matrix (df))
assists rebound points
assists 1.00 -0.24 -0.33
rebounds -0.24 1.00 -0.52
points -0.33 -0.52 1.00
n=8
P
assists rebound points
assists 0.5589 0.4253
rebounds 0.5589 0.1844
points 0.4253 0.1844
تظهر المصفوفة الأولى معاملات الارتباط بين المتغيرات وتظهر المصفوفة الثانية القيم الاحتمالية المقابلة.
على سبيل المثال، معامل الارتباط بين التمريرات الحاسمة والمرتدات هو -0.24 والقيمة p لمعامل الارتباط هذا هي 0.5589 .
وهذا يخبرنا أن الارتباط بين المتغيرين سلبي ولكنه ليس ارتباطًا ذا دلالة إحصائية حيث أن القيمة p لا تقل عن 0.05.
مثال 3: الدالة corrplot
يمكننا استخدام الدالة corrplot() من حزمة corrplot في R لتصور مصفوفة الارتباط:
library (corplot)
#visualize correlation matrix
corrplot(cor(df))
يساعدنا لون وحجم الدوائر في مصفوفة الارتباط على تصور الارتباطات بين كل متغير.
على سبيل المثال، الدائرة التي تتقاطع فيها المتغيرات المساعدة والمرتدات تكون صغيرة ولونها أحمر فاتح، مما يخبرنا أن الارتباط ضعيف وسالب.
مثال 4: الدالة corrplot
يمكننا استخدام الدالة ggcorrplot() من حزمة ggcorrplot في R لتصور مصفوفة الارتباط:
library (ggcorrplot)
#visualize correlation matrix
ggcorrplot(cor(df))
يساعدنا لون المربعات في مصفوفة الارتباط على تصور الارتباطات بين كل متغير.
مصادر إضافية
تشرح البرامج التعليمية التالية كيفية تنفيذ المهام الشائعة الأخرى في R:
كيفية حساب ارتباط رتبة سبيرمان في R
كيفية حساب الارتباط الجزئي في R
كيفية حساب الارتباط المنزلق في R