كيفية إنشاء مؤامرة qq في ggplot2 (مع مثال)


يتم استخدام مخطط QQ، وهو اختصار لعبارة “الكمية الكمية”، لتقييم ما إذا كانت مجموعة البيانات من المحتمل أن تأتي من التوزيع النظري.

في معظم الحالات، يتم استخدام هذا النوع من المخططات لتحديد ما إذا كانت مجموعة البيانات تتبع التوزيع الطبيعي أم لا.

إذا تم توزيع البيانات بشكل طبيعي، فإن النقاط على مخطط QQ سوف تقع على خط قطري مستقيم.

وعلى العكس من ذلك، إذا انحرفت النقاط بشكل كبير عن الخط القطري المستقيم، فمن غير المرجح أن يتم توزيع البيانات بشكل طبيعي.

لإنشاء مخطط QQ في ggplot2، يمكنك استخدام الدالتين stat_qq() و stat_qq_line() كما يلي:

 library (ggplot2)

ggplot(df, aes(sample=y)) +
  stat_qq() + 
  stat_qq_line()

توضح الأمثلة التالية كيفية استخدام بناء الجملة هذا لإنشاء مخطط QQ في سيناريوهين مختلفين.

مثال 1: مخطط QQ للبيانات العادية

يوضح الكود التالي كيفية إنشاء مجموعة بيانات موزعة بشكل طبيعي مع 200 ملاحظة وإنشاء مخطط QQ لمجموعة البيانات في R:

 library (ggplot2)

#make this example reproducible
set. seeds (1)

#create some fake data that follows a normal distribution
df <- data. frame (y=rnorm(200))

#create QQ plot
ggplot(df, aes(sample=y)) +
  stat_qq() + 
  stat_qq_line()

مؤامرة QQ في ggplot2

يمكننا أن نرى أن النقاط تقع بشكل أساسي على طول الخط القطري المستقيم مع بعض الانحرافات البسيطة على طول كل من الأطراف.

بناءً على هذا الرسم البياني، نفترض أن مجموعة البيانات هذه يتم توزيعها بشكل طبيعي.

لاحظ أنه يمكننا أيضًا استخدام وسيطات اللون والحجم لتغيير لون وحجم النقاط في المخطط إذا أردنا ذلك:

 library (ggplot2)

#make this example reproducible
set. seeds (1)

#create some fake data that follows a normal distribution
df <- data. frame (y=rnorm(200))

#create QQ plot
ggplot(df, aes(sample=y)) +
  stat_qq(size= 2.5 , color=' red ') + 
  stat_qq_line() 

مثال 2: مخطط QQ للبيانات غير العادية

يوضح التعليمة البرمجية التالية كيفية إنشاء مخطط QQ لمجموعة بيانات تتبع التوزيع الأسي مع 200 ملاحظة:

 #make this example reproducible
set. seeds (1)

#create some fake data that follows an exponential distribution
df <- data. frame (y=rexp( 200 , rate= 3 ))

#create QQ plot
ggplot(df, aes(sample=y)) +
  stat_qq() + 
  stat_qq_line()

نرى أن النقاط تنحرف بشكل كبير عن الخط القطري. يشير هذا بوضوح إلى أن مجموعة البيانات لا يتم توزيعها بشكل طبيعي.

يجب أن يكون هذا منطقيًا نظرًا لأننا حددنا أن البيانات يجب أن تتبع التوزيع الأسي.

مصادر إضافية

تشرح البرامج التعليمية التالية كيفية تنفيذ المهام الشائعة الأخرى في ggplot2:

كيفية رسم خطوط متعددة في ggplot2
كيفية رسم المتوسط والانحراف المعياري في ggplot2
كيفية تغيير ألوان الخط في ggplot2

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *