كيفية رسم البيانات الفئوية في r (مع أمثلة)


في الإحصائيات، تمثل البيانات الفئوية البيانات التي يمكن أن تأخذ أسماء أو تسميات.

الامثله تشمل:

  • حالة التدخين (“مدخن”، “غير مدخن”)
  • لون العين (“أزرق”، “أخضر”، “بندقي”)
  • مستوى التعليم (على سبيل المثال “المدرسة الثانوية”، “درجة البكالوريوس”، “درجة الماجستير”)

تتضمن ثلاثة مخططات شائعة الاستخدام لتصور هذا النوع من البيانات ما يلي:

  • شريط الرسم البياني
  • مؤامرات الفسيفساء
  • مؤامرات مربع حسب المجموعة

توضح الأمثلة التالية كيفية إنشاء كل من هذه المخططات في R.

مثال 1: المخططات الشريطية

يوضح التعليمة البرمجية التالية كيفية إنشاء مخطط شريطي لتصور تكرار التحولات في إطار بيانات معين:

 library (ggplot2)

#create data frame
df <- data. frame (result = c('W', 'L', 'W', 'W', 'W', 'L', 'W', 'L', 'W', 'L'),
                 team = c('B', 'B', 'B', 'B', 'D', 'A', 'A', 'A', 'C', 'C'),
                 points = c(12, 28, 19, 22, 32, 45, 22, 28, 13, 19),
                 rebounds = c(5, 7, 7, 12, 11, 4, 10, 7, 8, 8))

#create bar chart of teams
ggplot(df, aes (x=team)) +
  geom_bar()

يُظهر المحور السيني اسم كل فريق، ويُظهر المحور الصادي تكرار كل فريق في إطار البيانات.

يمكننا أيضًا استخدام الكود التالي لترتيب الأشرطة في المخطط من الأكبر إلى الأصغر:

 #create bar chart of teams, ordered from large to small
ggplot(df, aes (x= reorder (team, team, function (x)- length (x)))) +
  geom_bar(fill=' steelblue ') +
  labs(x=' Team ') 

مثال 2: مخططات الصندوق حسب المجموعة

تعد boxplots المجمعة طريقة مفيدة لتصور متغير رقمي، مجمعة بواسطة متغير فئوي.

على سبيل المثال، يوضح التعليمة البرمجية التالية كيفية إنشاء boxplots التي تظهر توزيع النقاط المسجلة، مجمعة حسب الفريق:

 library (ggplot2)

#create data frame
df <- data. frame (result = c('W', 'L', 'W', 'W', 'W', 'L', 'W', 'L', 'W', 'L'),
                 team = c('B', 'B', 'B', 'B', 'D', 'A', 'A', 'A', 'C', 'C'),
                 points = c(12, 28, 19, 22, 32, 45, 22, 28, 13, 19),
                 rebounds = c(5, 7, 7, 12, 11, 4, 10, 7, 8, 8))

#create boxplots of points, grouped by team
ggplot(df, aes (x=team, y=points)) +
  geom_boxplot(fill=' steelblue ')

يعرض المحور السيني الفرق بينما يعرض المحور الصادي توزيع النقاط التي سجلها كل فريق.

مثال 3: مؤامرة الفسيفساء

قطعة الأرض المبلطة هي نوع من قطعة الأرض التي تعرض ترددات متغيرين فئويين مختلفين في قطعة أرض واحدة.

على سبيل المثال، يوضح التعليمة البرمجية التالية كيفية إنشاء مخطط فسيفساء يوضح تكرار المتغيرات الفئوية “النتيجة” و”الفريق” في مخطط واحد:

 #create data frame
df <- data. frame (result = c('W', 'L', 'W', 'W', 'W', 'L', 'W', 'L', 'W', 'L'),
                 team = c('B', 'B', 'B', 'B', 'D', 'A', 'A', 'A', 'C', 'C'),
                 points = c(12, 28, 19, 22, 32, 45, 22, 28, 13, 19),
                 rebounds = c(5, 7, 7, 12, 11, 4, 10, 7, 8, 8))

#create table of counts
counts <- table(df$result, df$team)

#create mosaic plot
mosaicplot(counts, xlab=' Game Result ', ylab=' Team ',
           main=' Wins by Team ', col=' steelblue ') 

تضاريس الفسيفساء في R

يعرض المحور السيني نتيجة المباراة ويعرض المحور الصادي الفرق الأربعة المختلفة.

مصادر إضافية

تشرح البرامج التعليمية التالية كيفية إنشاء مخططات مشتركة أخرى في R:

كيفية إنشاء مخطط شريطي مكدس في R
كيفية إنشاء مخطط شريطي متفاوت المسافات في R
كيفية إنشاء مؤامرة نقطة مكدسة في R

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *