كيفية حساب الارتباط الجزئي في r
في الإحصاء، نستخدم غالبًا معامل ارتباط بيرسون لقياس العلاقة الخطية بين متغيرين.
ومع ذلك، في بعض الأحيان نريد أن نفهم العلاقة بين متغيرين مع التحكم في متغير ثالث .
على سبيل المثال، لنفترض أننا نريد قياس الارتباط بين عدد ساعات الدراسة للطالب ودرجة الاختبار النهائي، مع التحكم في الدرجة الحالية للطالب في الفصل الدراسي.
وفي هذه الحالة يمكننا استخدام الارتباط الجزئي لقياس العلاقة بين ساعات الدراسة ودرجة الامتحان النهائي.
يشرح هذا البرنامج التعليمي كيفية حساب الارتباط الجزئي في R.
مثال: الارتباط الجزئي في R
لنفترض أن لدينا إطار البيانات التالي الذي يعرض الدرجة الحالية وإجمالي ساعات الدراسة ودرجة الاختبار النهائي لـ 10 طلاب:
#create data frame df <- data. frame (currentGrade = c(82, 88, 75, 74, 93, 97, 83, 90, 90, 80), hours = c(4, 3, 6, 5, 4, 5, 8, 7, 4, 6), examScore = c(88, 85, 76, 70, 92, 94, 89, 85, 90, 93)) #view data frame df currentGrade hours examScore 1 82 4 88 2 88 3 85 3 75 6 76 4 74 5 70 5 93 4 92 6 97 5 94 7 83 8 89 8 90 7 85 9 90 4 90 10 80 6 93
لحساب الارتباط الجزئي بين كل مجموعة زوجية من المتغيرات في إطار البيانات، يمكننا استخدام الدالة pcor() من مكتبة ppcor :
library (ppcor)
#calculate partial correlations
pcor(df)
$estimate
currentGrade hours examScore
currentGrade 1.0000000 -0.3112341 0.7355673
hours -0.3112341 1.0000000 0.1906258
examScore 0.7355673 0.1906258 1.0000000
$p.value
currentGrade hours examScore
currentGrade 0.00000000 0.4149353 0.02389896
hours 0.41493532 0.0000000 0.62322848
examScore 0.02389896 0.6232285 0.00000000
$statistic
currentGrade hours examScore
currentGrade 0.0000000 -0.8664833 2.8727185
hours -0.8664833 0.0000000 0.5137696
examScore 2.8727185 0.5137696 0.0000000
$n
[1] 10
$gp
[1] 1
$method
[1] "pearson"
وإليك كيفية تفسير النتيجة:
العلاقة الجزئية بين ساعات الدراسة ودرجة الامتحان النهائي:
الارتباط الجزئي بين ساعات الدراسة ودرجة الامتحان النهائي هو 0.191 ، وهو ما يمثل ارتباطا إيجابيا صغيرا. ومع زيادة عدد ساعات الدراسة، تميل درجات الامتحانات أيضًا إلى الارتفاع، على افتراض أن الدرجة الحالية تظل ثابتة.
القيمة p لهذا الارتباط الجزئي هي 0.623 ، وهي ليست ذات دلالة إحصائية عند α = 0.05.
العلاقة الجزئية بين الدرجة الحالية ودرجة الامتحان النهائي:
الارتباط الجزئي بين الدرجة الحالية ودرجة الامتحان النهائي هو 0.736 وهو ما يمثل ارتباطا إيجابيا قويا. ومع زيادة الدرجة الحالية، تميل درجات الامتحانات أيضًا إلى الزيادة، على افتراض أن عدد ساعات الدراسة يظل ثابتًا.
القيمة p لهذا الارتباط الجزئي هي 0.024 ، وهي ذات دلالة إحصائية عند α = 0.05.
الارتباط الجزئي بين الصف الحالي والساعات الدراسية:
الارتباط الجزئي بين التقدير الحالي وساعات الدراسة ودرجة الامتحان النهائي هو -0.311 وهو ما يمثل ارتباطا سلبيا طفيفا. مع زيادة الدرجة الحالية، تميل درجة الاختبار النهائي إلى الانخفاض، على افتراض أن درجة الاختبار النهائي تظل ثابتة.
القيمة p لهذا الارتباط الجزئي هي 0.415 ، وهي ليست ذات دلالة إحصائية عند α = 0.05.
وتخبرنا النتيجة أيضًا أن الطريقة المستخدمة لحساب الارتباط الجزئي كانت “بيرسون”.
في الدالة pcor() ، يمكننا أيضًا تحديد “kendall” أو “pearson” كطرق بديلة لحساب الارتباطات.
مصادر إضافية
تشرح البرامج التعليمية التالية كيفية تنفيذ المهام الشائعة الأخرى في R:
كيفية حساب ارتباط رتبة سبيرمان في R
كيفية حساب الارتباط المتبادل في R
كيفية حساب الارتباط المنزلق في R
كيفية حساب الارتباط النقطي الثنائي في R