كيفية حساب الارتباط بين متغيرات متعددة في r


إحدى الطرق لقياس العلاقة بين متغيرين هي استخدام معامل ارتباط بيرسون ، وهو مقياس للارتباط الخطي بين متغيرين . يأخذ دائمًا قيمة بين -1 و1 حيث:

  • يشير -1 إلى وجود علاقة خطية سلبية تمامًا بين متغيرين
  • يشير 0 إلى عدم وجود علاقة خطية بين متغيرين
  • يشير الشكل 1 إلى وجود علاقة خطية إيجابية تمامًا بين متغيرين

يشرح هذا البرنامج التعليمي كيفية حساب الارتباط بين متغيرات متعددة في لغة R، باستخدام إطار البيانات التالي كمثال:

 #create data frame
df <- data.frame(a <- c(2, 3, 3, 5, 6, 9, 14, 15, 19, 21, 22, 23),
                 b <- c(23, 24, 24, 23, 17, 28, 38, 34, 35, 39, 41, 43),
                 c <- c(13, 14, 14, 14, 15, 17, 18, 19, 22, 20, 24, 26),
                 d <- c(6, 6, 7, 8, 8, 8, 7, 6, 5, 3, 3, 2))

مثال 1: العلاقة بين متغيرين

يوضح الكود التالي كيفية حساب الارتباط بين متغيرين في إطار البيانات:

 cor(df$a, df$b)

[1] 0.9279869

مثال 2: الارتباط بين عدة متغيرات

يوضح الكود التالي كيفية حساب الارتباط بين ثلاثة متغيرات في إطار البيانات:

 cor(df[, c(' a ', ' b ', ' c ')])

          ABC
a 1.0000000 0.9279869 0.9604329
b 0.9279869 1.0000000 0.8942139
c 0.9604329 0.8942139 1.0000000

وطريقة تفسير النتيجة هي كما يلي:

  • العلاقة بين a و b هي 0.9279869.
  • العلاقة بين a و c هي 0.9604329.
  • العلاقة بين b و c هي 0.8942139.

مثال 3: الارتباط بين جميع المتغيرات

يوضح الكود التالي كيفية حساب الارتباط بين كافة المتغيرات في إطار البيانات:

 cor(df)

           abcd
a 1.0000000 0.9279869 0.9604329 -0.7915488
b 0.9279869 1.0000000 0.8942139 -0.7917973
c 0.9604329 0.8942139 1.0000000 -0.8063549
d -0.7915488 -0.7917973 -0.8063549 1.0000000

مثال 4: الارتباط بين المتغيرات الرقمية فقط

يوضح التعليمة البرمجية التالية كيفية حساب الارتباط بين المتغيرات الرقمية فقط في إطار البيانات:

 cor(df[, unlist ( lapply (df, is. numeric ))])

           abcd
a 1.0000000 0.9279869 0.9604329 -0.7915488
b 0.9279869 1.0000000 0.8942139 -0.7917973
c 0.9604329 0.8942139 1.0000000 -0.8063549
d -0.7915488 -0.7917973 -0.8063549 1.0000000

المثال 5: تصور الارتباطات

يوضح التعليمة البرمجية التالية كيفية إنشاء مخطط ثنائي – نوع من المخطط يسمح لك بتصور العلاقة بين كل مجموعة زوجية من المتغيرات:

 #load psych package
library(psych)

#create pairs plot
peers. panels (df)

مصادر إضافية

كيفية حساب الارتباط الجزئي في R
كيفية حساب الارتباط النقطي الثنائي في R
كيفية حساب الارتباط المنزلق في R

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *