التوزيع ذو الحدين هو توزيع احتمالي يستخدم لنمذجة احتمالية حدوث عدد معين من “النجاحات” خلال عدد محدد من التجارب. يعتبر التوزيع ذو الحدين مناسبًا للاستخدام في حالة استيفاء الافتراضات الثلاثة التالية: الافتراض 1: كل تجربة لها نتيجتان محتملتان فقط. نحن نفترض...
الرسم النقطي هو نوع من الرسم الذي يعرض ترددات القيم في مجموعة البيانات باستخدام النقاط المكدسة. في كثير من الأحيان عندما نقوم بإنشاء مخطط نقطي، نريد تحديد المركز والتوزيع: المركز : النقطة المركزية لمجموعة البيانات. غالبًا ما نستخدم الوسيط لقياس ذلك....
الرسم البياني هو نوع من المخططات التي تسمح لنا بتصور توزيع القيم في مجموعة من البيانات. يُظهر المحور X قيم مجموعة البيانات ويُظهر المحور Y تكرار كل قيمة. اعتمادًا على القيم الموجودة في مجموعة البيانات، يمكن أن يتخذ الرسم البياني العديد...
القيمة المتطرفة هي ملاحظة بعيدة بشكل غير طبيعي عن القيم الأخرى في مجموعة البيانات. غالبًا ما نعرّف الملاحظة بأنها قيمة متطرفة إذا كانت 1.5 مرة من المدى الربيعي فوق الربع الثالث أو 1.5 مرة من المدى الربيعي أسفل الربع الأول. ملاحظة:...
فاصل الثقة هو نطاق من القيم التي من المحتمل أن تحتوي على معلمة سكانية بمستوى معين من الثقة. عندما نقوم بالإبلاغ عن فترات الثقة، نستخدم دائمًا التنسيق التالي: 95% فترة ثقة [LL، UL] ذهب LL : الحد الأدنى لفترة الثقة UL...
رسالة التحذير التي قد تواجهها في R هي: Warning message: glm.fit: fitted probabilities numerically 0 or 1 occurred يحدث هذا التحذير عندما تقوم بتركيب نموذج انحدار لوجستي ولا يمكن تمييز الاحتمالات المتوقعة لملاحظة واحدة أو أكثر في قاعدة البيانات الخاصة بك...
في كثير من الأحيان في الإحصاء والتعلم الآلي نقوم بتطبيع المتغيرات بحيث يكون نطاق القيم بين 0 و 1. السبب الأكثر شيوعًا لتطبيع المتغيرات هو عندما نقوم بإجراء نوع من التحليل متعدد المتغيرات (أي أننا نريد أن نفهم العلاقة بين العديد...
يتم استخدام ANOVA (“تحليل التباين”) لتحديد ما إذا كانت وسائل ثلاث مجموعات مستقلة أو أكثر متساوية أم لا. يستخدم تحليل التباين (ANOVA) الفرضيات الصفرية والبديلة التالية: H 0 : جميع وسائل المجموعة متساوية. HA : يختلف متوسط مجموعة واحدة على الأقل...
يتم حساب مسافة مانهاتن بين المتجهين A و B على النحو التالي: Σ|أ ط – ب ط | حيث i هو العنصر الأول لكل متجه. تُستخدم هذه المسافة لقياس الاختلاف بين ناقلين وتستخدم بشكل شائع في العديد من خوارزميات التعلم الآلي...
الانحراف المعياري المجمع هو ببساطة متوسط مرجح للانحرافات المعيارية لمجموعتين مستقلتين أو أكثر. في الإحصاء، يظهر بشكل شائع في اختبار t المكون من عينتين ، والذي يستخدم لاختبار ما إذا كانت متوسطات مجموعتين من السكان متساوية أم لا. صيغة حساب الانحراف...