كيفية إنشاء مصفوفة مخطط التشتت في لغة r (مثالان)


مصفوفة مخطط التشتت هي مصفوفة مخطط التشتت تسمح لك بفهم العلاقة الزوجية بين المتغيرات المختلفة في مجموعة البيانات.

هناك طريقتان شائعتان لإنشاء مصفوفة مخطط التشتت في R:

الطريقة الأولى: استخدم Base R

 #create scatterplot matrix (pch=20 means to use a solid circle for points)
plot(df, pch= 20 )

الطريقة الثانية: استخدام حزم ggplot2 وGGally

 library (ggplot2)
library (GGally)

#create scatterplot matrix
ggpairs(df)

توضح الأمثلة التالية كيفية استخدام كل طريقة عمليًا مع إطار البيانات التالي في R:

 #create data frame
df <- data. frame (points=c(99, 90, 86, 88, 95, 99, 101, 104),
                 assists=c(33, 28, 31, 39, 40, 40, 35, 47),
                 rebounds=c(30, 28, 24, 24, 20, 20, 15, 12))

#view first few rows of data frame
head(df)

  points assists rebounds
1 99 33 30
2 90 28 28
3 86 31 24
4 88 39 24
5 95 40 20
6 99 40 20

مثال 1: إنشاء مصفوفة مخطط التشتت باستخدام Base R

يمكننا استخدام الدالة Rplot() الأساسية لإنشاء مصفوفة مخطط التشتت لكل متغير في إطار البيانات الخاص بنا:

 #create scatterplot matrix
plot(df, pch= 20 , cex= 1.5 , col=' steelblue ')

مصفوفة مخطط التشتت في R

طريقة تفسير المصفوفة هي كما يلي:

  • يتم عرض أسماء المتغيرات على طول المربعات القطرية.
  • تعرض كافة المربعات الأخرى مخططًا مبعثرًا للعلاقة بين كل مجموعة زوجية من المتغيرات. على سبيل المثال، يعرض المربع الموجود في الزاوية اليمنى العليا من المصفوفة مخططًا مبعثرًا لقيم النقاط والمرتدات . تُظهر المنطقة اليسرى الوسطى مخططًا متناثرًا لقيم النقاط والتمريرات الحاسمة وما إلى ذلك.

لاحظ أن cex يتحكم في حجم النقاط في المسار ويتحكم col في لون النقاط.

المثال 2: إنشاء مصفوفة مخطط التشتت باستخدام ggplot2 وGGally

يمكننا أيضًا استخدام الدالة ggpairs() من حزم ggplot2 وGGally في R لإنشاء مصفوفة مخطط مبعثر لكل متغير في إطار البيانات الخاص بنا:

 library (ggplot2)
library (GGally)

#create scatterplot matrix
ggpairs(df) 

مصفوفة مخطط التشتت في ggplot2

تحتوي مصفوفة مخطط التشتت هذه على نفس مخططات التشتت الموجودة في دالة R baseplot () ، ولكن بالإضافة إلى ذلك يمكننا أيضًا رؤية معامل الارتباط بين كل مجموعة زوجية من المتغيرات بالإضافة إلى مخطط الكثافة لكل متغير على حدة.

على سبيل المثال يمكننا أن نرى:

  • معامل الارتباط بين التمريرات الحاسمة والنقاط هو 0.571 .
  • معامل الارتباط بين المرتدات والنقاط هو -0.598 .
  • معامل الارتباط بين المرتدات والتمريرات الحاسمة هو -0.740 .

تشير النجمة الصغيرة ( * ) بجوار -0.740 أيضًا إلى أن الارتباط بين الكرات المرتدة والتمريرات الحاسمة له دلالة إحصائية.

مصادر إضافية

تشرح البرامج التعليمية التالية كيفية تنفيذ المهام الشائعة الأخرى في R:

كيفية إنشاء مصفوفة الارتباط في R
كيفية إنشاء السحب النقطية حسب المجموعة في R

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *