في بعض الأحيان قد ترغب في إزالة عمود الفهرس من pandas DataFrame في Python. نظرًا لأن DataFrames وSeries من الباندا تحتوي دائمًا على فهرس، فلا يمكنك فعليًا إسقاط الفهرس، ولكن يمكنك إعادة تعيينه باستخدام الجزء التالي من التعليمات البرمجية: df. reset_index...
التعزيز هو أسلوب للتعلم الآلي أثبت أنه ينتج نماذج ذات دقة تنبؤية عالية. إحدى الطرق الأكثر شيوعًا لتنفيذ التعزيز عمليًا هي استخدام XGBoost ، وهو اختصار لـ “extreme gradient boosting”. يقدم هذا البرنامج التعليمي مثالاً خطوة بخطوة حول كيفية استخدام XGBoost...
في كثير من الأحيان في الإحصائيات نريد الإجابة على أسئلة مثل: ما هو متوسط دخل الأسرة في مدينة معينة؟ ما هو متوسط وزن نوع معين من السلاحف؟ ما هو متوسط الحضور لمباريات كرة القدم الجامعية؟ في كل سيناريو، نريد الإجابة على...
يقيس معامل ارتباط بيرسون الارتباط الخطي بين متغيرين. يأخذ دائمًا قيمة بين -1 و1 حيث: يشير -1 إلى وجود علاقة خطية سلبية تمامًا بين متغيرين يشير 0 إلى عدم وجود علاقة خطية بين متغيرين يشير الشكل 1 إلى وجود علاقة خطية...
لتطبيع القيم في مجموعة بيانات بين 0 و100، يمكنك استخدام الصيغة التالية: ض i = (x i – دقيقة(x)) / (الحد الأقصى(x) – دقيقة(x)) * 100 ذهب: z i : القيمة المقيسة في مجموعة البيانات x i : القيمة i لمجموعة...
في الإحصاء، الملاحظة هي ببساطة حدوث شيء تقيسه. على سبيل المثال، لنفترض أنك تقوم بقياس وزن نوع معين من السلاحف. تعتبر كل سلحفاة تقوم بجمع وزنها بمثابة ملاحظة واحدة. تحتوي مجموعة البيانات التالية على أوزان 15 سلحفاة مختلفة، لذلك هناك 15...
تحليل المكونات الرئيسية، والذي غالبًا ما يتم اختصاره PCA، هو تقنية تعلم آلي غير خاضعة للرقابة تسعى إلى العثور على المكونات الرئيسية – مجموعات خطية من المتنبئين الأصليين – التي تفسر جزءًا كبيرًا من الاختلاف في مجموعة البيانات. الهدف من PCA...
يتم استخدام ANOVA أحادي الاتجاه لتحديد ما إذا كان هناك فرق ذو دلالة إحصائية بين متوسطات ثلاث مجموعات مستقلة أو أكثر أم لا. إذا كانت القيمة الاحتمالية الإجمالية لجدول تحليل التباين (ANOVA) أقل من مستوى معين من الأهمية، فلدينا أدلة كافية...
يتم استخدام ANOVA أحادي الاتجاه لتحديد ما إذا كان هناك فرق ذو دلالة إحصائية بين متوسطات ثلاث مجموعات مستقلة أو أكثر أم لا. إذا كانت القيمة الاحتمالية الإجمالية لجدول تحليل التباين (ANOVA) أقل من مستوى معين من الأهمية، فلدينا أدلة كافية...
في بعض الأحيان قد ترغب في إضافة مصفوفة NumPy كعمود جديد إلى pandas DataFrame. لحسن الحظ، يمكنك القيام بذلك بسهولة باستخدام بناء الجملة التالي: df[' new_column '] = array_name. tolist () يوضح هذا البرنامج التعليمي بعض الأمثلة على الاستخدام العملي لهذه...