كيفية تطبيق القاعدة الأساسية في r
القاعدة الأساسية ، التي تسمى أحيانًا قاعدة 68-95-99.7، تنص على أنه بالنسبة لمجموعة بيانات معينة ذات توزيع طبيعي:
- 68% من قيم البيانات تقع ضمن انحراف معياري واحد عن الوسط.
- 95% من قيم البيانات تقع ضمن انحرافين معياريين عن المتوسط.
- 99.7% من قيم البيانات تقع ضمن ثلاثة انحرافات معيارية عن المتوسط.
في هذا البرنامج التعليمي، نشرح كيفية تطبيق القاعدة الأساسية في لغة R على مجموعة بيانات معينة.
تطبيق القاعدة الأساسية في R
تقوم الدالة pnorm() في R بإرجاع قيمة دالة الكثافة التراكمية للتوزيع الطبيعي.
تستخدم هذه الوظيفة بناء الجملة الأساسي التالي:
بنورم (ف، يعني، التنمية المستدامة)
ذهب:
- q : قيمة المتغير العشوائي الموزع عادة
- يعني : يعني التوزيع
- sd : الانحراف المعياري للتوزيع
يمكننا استخدام الصيغة التالية للعثور على المنطقة الواقعة تحت منحنى التوزيع الطبيعي الذي يقع بين الانحرافات المعيارية المختلفة:
#find area under normal curve within 1 standard deviation of mean pnorm(1) - pnorm(-1) [1] 0.6826895 #find area under normal curve within 2 standard deviations of mean pnorm(2) - pnorm(-2) [1] 0.9544997 #find area under normal curve within 3 standard deviations of mean pnorm(3) - pnorm(-3) [1] 0.9973002
ومن النتيجة يمكننا أن نؤكد:
- 68% من قيم البيانات تقع ضمن انحراف معياري واحد عن الوسط.
- 95% من قيم البيانات تقع ضمن انحرافين معياريين عن المتوسط.
- 99.7% من قيم البيانات تقع ضمن ثلاثة انحرافات معيارية عن المتوسط.
توضح الأمثلة التالية كيفية استخدام القاعدة العامة مع مجموعات البيانات المختلفة عمليًا.
مثال 1: تطبيق القاعدة التجريبية على مجموعة بيانات في R
لنفترض أن لدينا مجموعة بيانات موزعة بشكل طبيعي بمتوسط 7 وانحراف معياري قدره 2.2 .
يمكننا استخدام الكود التالي لتحديد القيم التي تحتوي على 68% و95% و99.7% من البيانات:
#define mean and standard deviation values mean=7 sd=2.2 #find which values contain 68% of data mean-2.2; mean+2.2 [1] 4.8 [1] 9.2 #find which values contain 95% of data mean-2*2.2; mean+2*2.2 [1] 2.6 [1] 11.4 #find which values contain 99.7% of data mean-3*2.2; mean+3*2.2 [1] 0.4 [1] 13.6
ومن هذا الناتج يمكننا أن نرى:
- 68% من البيانات تتراوح بين 4.8 و 9.2
- 95% من البيانات تتراوح بين 2.6 و 11.4
- 99.7% من البيانات تتراوح بين 0.4 و 13.6
مثال 2: تحديد النسبة المئوية للبيانات التي تقع بين قيم معينة
تخيل أن لدينا مجموعة بيانات موزعة بشكل طبيعي بمتوسط 100 وانحراف معياري قدره 5.
لنفترض أننا نريد معرفة النسبة المئوية للبيانات التي تقع بين القيمتين 99 و 105 في هذا التوزيع.
يمكننا استخدام الدالة pnorm( ) للعثور على الإجابة:
#find area under normal curve between 99 and 105
pnorm(105, mean=100, sd=5) - pnorm(99, mean=100, sd=5)
[1] 0.4206045
نرى أن 42.06% من البيانات تقع بين القيمتين 99 و105 لهذا التوزيع.
مصادر إضافية
كيفية تطبيق القاعدة الأساسية في Excel
مشاكل في ممارسة قواعد الإبهام
قواعد حاسبة الإبهام