كيفية إنشاء مصفوفة الارتباط في sas (مع مثال)
مصفوفة الارتباط عبارة عن جدول مربع يوضح معاملات الارتباط بين المتغيرات في مجموعة البيانات.
فهو يوفر طريقة سريعة لفهم قوة العلاقات الخطية الموجودة بين المتغيرات في مجموعة البيانات.
يمكنك استخدام عبارة PROC CORR في SAS لإنشاء مصفوفة ارتباط لمجموعة بيانات معينة:
/*create correlation matrix using all numeric variables in my_data*/
proc corr data =my_data;
run ;
افتراضيًا، سيؤدي هذا إلى إنشاء مصفوفة تعرض معاملات الارتباط بين كافة المتغيرات الرقمية في مجموعة البيانات.
لتضمين متغيرات محددة فقط في مصفوفة الارتباط، يمكنك استخدام عبارة VAR :
/*create correlation matrix using only var1, var2 and var3 in my_data*/
proc corr data =my_data;
var var1, var2, var3;
run ;
يوضح المثال التالي كيفية إنشاء مصفوفة ارتباط في SAS.
مثال: إنشاء مصفوفة الارتباط في SAS
لنفترض أن لدينا مجموعة البيانات التالية في SAS والتي تحتوي على معلومات حول العديد من لاعبي كرة السلة:
/*create dataset*/
data my_data;
input team $ assists rebounds points;
datalines ;
A 4 12 22
A 5 14 24
A 5 13 26
A 6 7 26
B 7 8 29
B 8 8 32
B 8 9 20
B 10 13 14
;
run ;
/*view dataset*/
proc print data =my_data;
يمكننا استخدام عبارة PROC CORR لإنشاء مصفوفة ارتباط تتضمن كل متغير رقمي في مجموعة البيانات افتراضيًا:
/*create correlation matrix using all numeric variables in my_data*/
proc corr data =my_data;
run ;
يعرض الإخراج إحصائيات ملخصة للمتغيرات الرقمية في الجدول الأول مع مصفوفة الارتباط.
لاحظ أن متغير “الفريق” لم يتم تضمينه في مصفوفة الارتباط لأنه لم يكن متغيرًا رقميًا.
إليك كيفية تفسير قيم مصفوفة الارتباط:
(1) معامل ارتباط بيرسون (r) بين التمريرات الحاسمة والمرتدات هو -0.24486 . القيمة p المقابلة هي 0.5589 .
وبما أن r أقل من الصفر، فهذا يخبرنا بوجود ارتباط خطي سلبي بين هذين المتغيرين. ومع ذلك، فإن القيمة p لا تقل عن 0.05، وبالتالي فإن هذا الارتباط ليس ذا دلالة إحصائية.
(2) معامل ارتباط بيرسون (r) بين التمريرات الحاسمة والنقاط هو -0.32957 . القيمة p المقابلة هي 0.4253 .
هناك ارتباط خطي سلبي بين هذين المتغيرين ولكنه ليس ذو دلالة إحصائية.
(3) معامل ارتباط بيرسون (r) بين الكرات المرتدة والنقاط هو -0.52209 . القيمة p المقابلة هي 0.1844 .
يوجد ارتباط خطي سلبي بين هذين المتغيرين ولكنه ليس ذو دلالة إحصائية.
لاحظ أنه يمكننا أيضًا استخدام عبارة VAR لتضمين متغيرات رقمية محددة فقط في مصفوفة الارتباط:
/*create correlation matrix using only assists and rebounds variables*/
proc corr data =my_data;
var assists rebounds;
run ;
لاحظ أنه تم تضمين متغيرات التمريرات الحاسمة والمرتدات فقط في مصفوفة الارتباط هذه.
مصادر إضافية
تشرح البرامج التعليمية التالية كيفية تنفيذ المهام الشائعة الأخرى في SAS:
كيفية إنشاء مصفوفة مخطط التشتت في SAS
كيفية إنشاء الجداول المحورية في SAS
كيفية حساب عامل التضخم التباين (VIF) في SAS