هناك طريقتان بسيطتان لفرز إطار البيانات حسب التاريخ في R: الطريقة الأولى: أمر المستخدم () من قاعدة R #sort from least recent to most recent df[ order ( as.Date (df$date, format=" %m/%d/%Y ")),] #sort from most recent to least recent df[...
التحليل التمييزي الخطي هو طريقة يمكنك استخدامها عندما يكون لديك مجموعة من المتغيرات المتوقعة وترغب في تصنيف متغير الاستجابة إلى فئتين أو أكثر. يقدم هذا البرنامج التعليمي مثالاً خطوة بخطوة لكيفية إجراء التحليل التمييزي الخطي في بايثون. الخطوة 1: تحميل المكتبات...
عندما يكون لدينا مجموعة من المتغيرات المتوقعة ونريد تصنيف متغير الاستجابة إلى إحدى الفئتين، فإننا نستخدم بشكل عام الانحدار اللوجستي . ومع ذلك، عندما يحتوي متغير الاستجابة على أكثر من فئتين محتملتين، فإننا نستخدم عمومًا التحليل التمييزي الخطي ، والذي يُسمى...
التحليل التمييزي التربيعي هو طريقة يمكنك استخدامها عندما يكون لديك مجموعة من المتغيرات المتوقعة وتريد تصنيف متغير الاستجابة إلى فئتين أو أكثر. ويعتبر المعادل غير الخطي للتحليل التمييزي الخطي . يقدم هذا البرنامج التعليمي مثالاً خطوة بخطوة لكيفية إجراء تحليل التمييز...
التحليل التمييزي التربيعي هو طريقة يمكنك استخدامها عندما يكون لديك مجموعة من المتغيرات المتوقعة وتريد تصنيف متغير الاستجابة إلى فئتين أو أكثر. ويعتبر المعادل غير الخطي للتحليل التمييزي الخطي . يقدم هذا البرنامج التعليمي مثالاً خطوة بخطوة لكيفية إجراء التحليل التمييزي...
غالبًا ما يأخذ الباحثون عينات من السكان ويستخدمون البيانات من العينة لاستخلاص استنتاجات حول السكان ككل. طريقة أخذ العينات شائعة الاستخدام هي أخذ العينات العنقودية ، حيث يتم تقسيم السكان إلى مجموعات ويتم اختيار جميع أعضاء مجموعات معينة لإدراجهم في العينة....
غالبًا ما يأخذ الباحثون عينات من السكان ويستخدمون البيانات من العينة لاستخلاص استنتاجات حول السكان ككل. طريقة أخذ العينات شائعة الاستخدام هي أخذ العينات المنهجية ، والتي يتم تنفيذها في عملية بسيطة من خطوتين: 1. ضع كل فرد من السكان في...
الارتباطات المتداولة هي الارتباطات بين سلسلتين زمنيتين عبر نافذة منزلقة. إحدى فوائد هذا النوع من الارتباط هو أنه يمكنك تصور الارتباط بين سلسلتين زمنيتين مع مرور الوقت. يشرح هذا البرنامج التعليمي كيفية حساب وتصور الارتباطات المتداولة لـ pandas DataFrame في Python....
لتقييم أداء نموذج ما على مجموعة بيانات، نحتاج إلى قياس مدى مطابقة التنبؤات التي قدمها النموذج مع البيانات المرصودة. الطريقة الأكثر شيوعًا لقياس ذلك هي استخدام متوسط مربع الخطأ (MSE)، والذي يتم حسابه على النحو التالي: MSE = (1/n)*Σ(y i –...
لتقييم أداء نموذج ما على مجموعة بيانات، نحتاج إلى قياس مدى مطابقة التنبؤات التي قدمها النموذج مع البيانات المرصودة. تُعرف إحدى الطرق المستخدمة بشكل شائع للقيام بذلك باسم “التحقق من صحة المغادرة لمرة واحدة” (LOOCV) ، والتي تستخدم الطريقة التالية: 1....