معامل ارتباط ماثيوز (MCC) هو مقياس يمكننا استخدامه لتقييم أداء نموذج التصنيف . يتم حسابه على النحو التالي: مركز عملائي = (TP*TN – FP*FN) / √ (TP+FP)(TP+FN)(TN+FP)(TN+FN) ذهب: TP : عدد النتائج الإيجابية الحقيقية TN : عدد السلبيات الحقيقية FP :...
يمكنك استخدام بناء الجملة الأساسي التالي في dplyr لتحويل متغير إذا كان العمود يحتوي على سلسلة معينة: library (dplyr) df %>% mutate_at(vars(contains(' starter ')), ~ (scale(.) %>% as. vector )) يطبق بناء الجملة هذا وظيفة المقياس () على كل متغير في...
الرسم البياني هو مخطط يمكن استخدامه لتصور توزيع القيم في مجموعة البيانات بسرعة. يقدم هذا البرنامج التعليمي مثالاً خطوة بخطوة حول كيفية إنشاء رسم بياني في جداول بيانات Google وتغيير عدد المربعات بحيث يظهر الرسم البياني بالطريقة التي تريدها تمامًا. الخطوة...
المتوسط المقطوع هو متوسط مجموعة البيانات التي تم حسابها بعد إزالة نسبة معينة من أصغر وأكبر القيم في مجموعة البيانات. على سبيل المثال، سيمثل المتوسط المقطوع بنسبة 10% متوسط مجموعة البيانات بعد إزالة 10% من القيم من نهايات مجموعة البيانات. لحساب...
المتوسط المقطوع هو متوسط مجموعة البيانات التي تم حسابها بعد إزالة نسبة معينة من أصغر وأكبر القيم في مجموعة البيانات. على سبيل المثال، سيمثل المتوسط المقطوع بنسبة 10% متوسط مجموعة البيانات بعد إزالة أعلى 10% من القيم من نهايات مجموعة البيانات....
في لغة برمجة R، يعد data.frame جزءًا من قاعدة بيانات R. يمكن تحويل أي data.frame إلى data.table باستخدام الدالة setDF الخاصة بحزمة data.table . يوفر data.table المزايا التالية مقارنة بإطار data.frame في R: 1. يمكنك استخدام الدالة fread من الحزمة data.table...
في نموذج الانحدار الخطي، يخبرنا معامل الانحدار بمتوسط التغير في متغير الاستجابة المرتبط بزيادة وحدة واحدة في متغير التوقع. يمكننا استخدام الصيغة التالية لحساب فاصل الثقة لمعامل الانحدار: فاصل الثقة لـ β 1 : b 1 ± t 1-α/2, n-2 *...
في كثير من الأحيان قد ترغب في طباعة سلسلة ومتغير على نفس السطر في R. ولحسن الحظ، من السهل القيام بذلك باستخدام الدالتين print() و paste0() . يوضح المثال التالي كيفية القيام بذلك. مثال: طباعة سلسلة ومتغير على نفس السطر في...
تُعرف إحدى خوارزميات التجميع الأكثر استخدامًا في التعلم الآلي باسم التجميع بوسائل k . إن تجميع وسائل K هو أسلوب نضع فيه كل ملاحظة من مجموعة بيانات في إحدى مجموعات K. الهدف النهائي هو الحصول على مجموعات K حيث تكون الملاحظات...
الانحدار اللوجستي هو طريقة يمكننا استخدامها لتناسب نموذج الانحدار عندما يكون متغير الاستجابة ثنائيًا. يوضح المثال التالي خطوة بخطوة كيفية إجراء الانحدار اللوجستي في جداول بيانات Google. الخطوة 1: تثبيت حزمة أدوات تحليل XLMiner لإجراء الانحدار اللوجستي في جداول بيانات Google،...