كيفية إنشاء وتفسير المؤامرات الزوجية في r
المخطط الزوجي عبارة عن مصفوفة مخطط مبعثر تسمح لك بفهم العلاقة الزوجية بين المتغيرات المختلفة في مجموعة البيانات.
لحسن الحظ، من السهل إنشاء مخطط أزواج في R باستخدام الدالة أزواج () . يقدم هذا البرنامج التعليمي عدة أمثلة للاستخدام العملي لهذه الوظيفة.
المثال 1: مخطط زوجي لجميع المتغيرات
يوضح التعليمة البرمجية التالية كيفية إنشاء مخطط زوج أساسي لجميع المتغيرات في إطار البيانات في R:
#make this example reproducible set.seed(0) #create data frame var1 <- rnorm(1000) var2 <- var1 + rnorm(1000, 0, 2) var3 <- var2 - rnorm(1000, 0, 5) df <- data.frame(var1, var2, var3) #create pairs plot peers(df)
طريقة تفسير المصفوفة هي كما يلي:
- يتم عرض أسماء المتغيرات على طول المربعات القطرية.
- تعرض كافة المربعات الأخرى مخططًا مبعثرًا للعلاقة بين كل مجموعة زوجية من المتغيرات. على سبيل المثال، تعرض المنطقة الموجودة في الزاوية اليمنى العليا من المصفوفة مخططًا مبعثرًا لقيم var1 و var3 . يعرض المربع الأيسر الأوسط مخططًا مبعثرًا لقيم var1 و var2 وما إلى ذلك.
يمنحنا هذا الرسم البياني الفردي فكرة عن العلاقة بين كل زوج من المتغيرات في مجموعة البيانات الخاصة بنا. على سبيل المثال، يبدو أن var1 و var2 مرتبطان بشكل إيجابي بينما يبدو أن var1 و var3 لديهما ارتباط ضئيل أو معدوم.
المثال 2: رسم أزواج من متغيرات محددة
يوضح التعليمة البرمجية التالية كيفية إنشاء مخطط زوج أساسي للمتغيرين الأولين فقط في مجموعة البيانات:
#create pairs plot for var1 and var2 only
even(df[, 1:2])
مثال 3: تغيير جماليات الحبكة الزوجية
يوضح التعليمة البرمجية التالية كيفية تغيير جماليات مؤامرة الأزواج، بما في ذلك العنوان واللون والتسميات:
peers(df, col = ' blue ', #modify color labels = c(' First ', ' Second ', ' Third '), #modify labels main = ' Custom Title ') #modify title
مثال 4: الحصول على الارتباطات باستخدام ggpairs
يمكنك أيضًا الحصول على معامل ارتباط بيرسون بين المتغيرات باستخدام الدالة ggpairs() من مكتبة GGally. يوضح الكود التالي كيفية استخدام هذه الوظيفة:
#install necessary libraries install.packages('ggplot2') install.packages('GGally') #load libraries library(ggplot2) library(GGally) #create pairs plot ggpairs(df)
وطريقة تفسير هذه المصفوفة هي كما يلي:
- يتم عرض أسماء المتغيرات على الحواف الخارجية للمصفوفة.
- تعرض المربعات الموجودة على طول الأقطار مخطط الكثافة لكل متغير.
- تعرض المربعات الموجودة في الزاوية اليسرى السفلية مخطط التشتت بين كل متغير.
- تعرض المربعات الموجودة في الزاوية اليمنى العليا معامل ارتباط بيرسون بين كل متغير. على سبيل المثال، الارتباط بين var1 وvar2 هو 0.425 .
تتمثل ميزة استخدام ggpairs() على وظيفة R Pairs() الأساسية في أنه يمكنك الحصول على مزيد من المعلومات حول المتغيرات. على وجه التحديد، يمكنك رؤية معامل الارتباط بين كل مجموعة زوجية من المتغيرات بالإضافة إلى مخطط الكثافة لكل متغير على حدة.
يمكنك العثور على الوثائق الكاملة لوظيفة ggpairs() هنا .