كيفية إنشاء مصفوفة مخطط التشتت في لغة r (مثالان)
مصفوفة مخطط التشتت هي مصفوفة مخطط التشتت تسمح لك بفهم العلاقة الزوجية بين المتغيرات المختلفة في مجموعة البيانات.
هناك طريقتان شائعتان لإنشاء مصفوفة مخطط التشتت في R:
الطريقة الأولى: استخدم Base R
#create scatterplot matrix (pch=20 means to use a solid circle for points) plot(df, pch= 20 )
الطريقة الثانية: استخدام حزم ggplot2 وGGally
library (ggplot2) library (GGally) #create scatterplot matrix ggpairs(df)
توضح الأمثلة التالية كيفية استخدام كل طريقة عمليًا مع إطار البيانات التالي في R:
#create data frame df <- data. frame (points=c(99, 90, 86, 88, 95, 99, 101, 104), assists=c(33, 28, 31, 39, 40, 40, 35, 47), rebounds=c(30, 28, 24, 24, 20, 20, 15, 12)) #view first few rows of data frame head(df) points assists rebounds 1 99 33 30 2 90 28 28 3 86 31 24 4 88 39 24 5 95 40 20 6 99 40 20
مثال 1: إنشاء مصفوفة مخطط التشتت باستخدام Base R
يمكننا استخدام الدالة Rplot() الأساسية لإنشاء مصفوفة مخطط التشتت لكل متغير في إطار البيانات الخاص بنا:
#create scatterplot matrix
plot(df, pch= 20 , cex= 1.5 , col=' steelblue ')
طريقة تفسير المصفوفة هي كما يلي:
- يتم عرض أسماء المتغيرات على طول المربعات القطرية.
- تعرض كافة المربعات الأخرى مخططًا مبعثرًا للعلاقة بين كل مجموعة زوجية من المتغيرات. على سبيل المثال، يعرض المربع الموجود في الزاوية اليمنى العليا من المصفوفة مخططًا مبعثرًا لقيم النقاط والمرتدات . تُظهر المنطقة اليسرى الوسطى مخططًا متناثرًا لقيم النقاط والتمريرات الحاسمة وما إلى ذلك.
لاحظ أن cex يتحكم في حجم النقاط في المسار ويتحكم col في لون النقاط.
المثال 2: إنشاء مصفوفة مخطط التشتت باستخدام ggplot2 وGGally
يمكننا أيضًا استخدام الدالة ggpairs() من حزم ggplot2 وGGally في R لإنشاء مصفوفة مخطط مبعثر لكل متغير في إطار البيانات الخاص بنا:
library (ggplot2) library (GGally) #create scatterplot matrix ggpairs(df)
تحتوي مصفوفة مخطط التشتت هذه على نفس مخططات التشتت الموجودة في دالة R baseplot () ، ولكن بالإضافة إلى ذلك يمكننا أيضًا رؤية معامل الارتباط بين كل مجموعة زوجية من المتغيرات بالإضافة إلى مخطط الكثافة لكل متغير على حدة.
على سبيل المثال يمكننا أن نرى:
- معامل الارتباط بين التمريرات الحاسمة والنقاط هو 0.571 .
- معامل الارتباط بين المرتدات والنقاط هو -0.598 .
- معامل الارتباط بين المرتدات والتمريرات الحاسمة هو -0.740 .
تشير النجمة الصغيرة ( * ) بجوار -0.740 أيضًا إلى أن الارتباط بين الكرات المرتدة والتمريرات الحاسمة له دلالة إحصائية.
مصادر إضافية
تشرح البرامج التعليمية التالية كيفية تنفيذ المهام الشائعة الأخرى في R:
كيفية إنشاء مصفوفة الارتباط في R
كيفية إنشاء السحب النقطية حسب المجموعة في R