كيفية إنشاء مؤامرة qq في بايثون
غالبًا ما يتم استخدام مخطط QQ ، وهو اختصار لـ “الكمي الكمي”، لتقييم ما إذا كانت مجموعة البيانات من المحتمل أن تأتي من التوزيع النظري أم لا.
في معظم الحالات، يتم استخدام هذا النوع من المخططات لتحديد ما إذا كانت مجموعة البيانات تتبعالتوزيع الطبيعي أم لا.
يشرح هذا البرنامج التعليمي كيفية إنشاء مخطط QQ لمجموعة بيانات في Python.
مثال: مؤامرة QQ في بايثون
لنفترض أن لدينا مجموعة البيانات التالية المكونة من 100 قيمة:
import numpy as np #create dataset with 100 values that follows a normal distribution np.random.seed(0) data = np.random.normal(0,1, 1000) #view first 10 values data[:10] array([ 1.76405235, 0.40015721, 0.97873798, 2.2408932 , 1.86755799, -0.97727788, 0.95008842, -0.15135721, -0.10321885, 0.4105985 ])
لإنشاء مخطط QQ لمجموعة البيانات هذه، يمكننا استخدام الدالة qqplot() من مكتبة statsmodels:
import statsmodels.api as sm import matplotlib.pyplot as plt #create QQ plot with 45-degree line added to plot fig = sm.qqplot(data, line='45') plt.show()
في مخطط QQ، يعرض المحور السيني الكميات النظرية . وهذا يعني أنها لا تظهر بياناتك الفعلية، بل تمثل المكان الذي ستكون فيه بياناتك إذا تم توزيعها بشكل طبيعي.
يعرض المحور Y بياناتك الحالية . وهذا يعني أنه إذا كانت قيم البيانات تتبع خطًا مستقيمًا تقريبًا بزاوية 45 درجة، فسيتم توزيع البيانات بشكل طبيعي.
يمكننا أن نرى في مخطط QQ أعلاه أن قيم البيانات تميل إلى اتباع 45 درجة عن كثب، مما يعني أنه من المحتمل أن يتم توزيع البيانات بشكل طبيعي. لا ينبغي أن يكون هذا مفاجئًا لأننا أنشأنا 100 قيمة بيانات باستخدام الدالة numpy.random.normal() .
بدلاً من ذلك، فكر فيما إذا قمنا بإنشاء مجموعة بيانات مكونة من 100 قيمة موزعة بشكل موحد وقمنا بإنشاء مخطط QQ لمجموعة البيانات هذه:
#create dataset of 100 uniformly distributed values data = np.random.uniform(0,1, 1000) #generate QQ plot for the dataset fig = sm.qqplot(data, line='45') plt.show()
ومن الواضح أن قيم البيانات لا تتبع الخط الأحمر 45 درجة، مما يشير إلى أنها لا تتبع التوزيع الطبيعي.
ملاحظات على مؤامرات QQ
ضع في اعتبارك الملاحظات التالية حول مخططات QQ:
- على الرغم من أن مخطط QQ ليس اختبارًا إحصائيًا رسميًا، إلا أنه يوفر طريقة بسيطة للتحقق بصريًا مما إذا كانت مجموعة البيانات موزعة بشكل طبيعي أم لا.
- احرص على عدم الخلط بين مخططات QQ ومخططات PP ، وهي أقل استخدامًا وأقل فائدة في تحليل قيم البيانات التي تقع في ذيل التوزيع.
يمكنك العثور على المزيد من دروس بايثون هنا .