في الإحصاء، يعد تباعد كولباك-ليبلر (KL) مقياسًا للمسافة يحدد الفرق بين توزيعين احتماليين. إذا كان لدينا توزيعان احتماليان، P و Q، فإننا نكتب عمومًا تباعد KL باستخدام الرمز KL(P || Q)، والذي يعني “اختلاف P عن Q”. ونحسبها باستخدام الصيغة التالية:...
يمكنك استخدام الطرق التالية للحصول على أسماء الأعمدة لإطار البيانات في R: الطريقة الأولى: الحصول على كافة أسماء الأعمدة colnames(df) الطريقة الثانية: الحصول على أسماء الأعمدة أبجديًا sort(colnames(df)) الطريقة الثالثة: الحصول على أسماء الأعمدة بنوع بيانات محدد colnames(df[,sapply(df, is.numeric )]) توضح...
في كثير من الأحيان قد ترغب في رسم المتوسط والانحراف المعياري حسب المجموعة في ggplot2. لحسن الحظ، من السهل القيام بذلك باستخدام الدالتين Geom_point() و geom_errorbar() في ggplot2. يوضح المثال التالي كيفية استخدام هذه الوظائف لإنشاء الرسم البياني التالي الذي يوضح...
يمكنك استخدام أي من الطرق التالية لحساب الانحراف المعياري حسب المجموعة في R: الطريقة الأولى: استخدام قاعدة R aggregate(df$col_to_aggregate, list(df$col_to_group_by), FUN=sd) الطريقة الثانية: استخدم dplyr library (dplyr) df %>% group_by(col_to_group_by) %>% summarise_at(vars(col_to_aggregate), list(name=sd)) الطريقة الثالثة: استخدام data.table library (data.table) setDT(df) dt[...
في تحليل الانحدار، تحدث العلاقة الخطية المتعددة عندما يرتبط متغيران أو أكثر من متغيرات التوقع ارتباطًا وثيقًا ببعضهما البعض، بحيث لا يوفران معلومات فريدة أو مستقلة في نموذج الانحدار. إذا كانت درجة الارتباط عالية بما يكفي بين متغيرات التوقع، فقد يتسبب...
يمكنك استخدام أي من الطرق التالية لإزالة أعمدة متعددة من إطار البيانات في R باستخدام حزمة dplyr : 1. قم بإزالة أعمدة متعددة بالاسم df_new <- df %>% select(-c(col2, col4)) 2. قم بإزالة كافة الأعمدة من النطاق df_new <- df %>%...
يمكنك استخدام بناء الجملة الأساسي التالي لإضافة تسمية إلى خط أفقي في ggplot2: + annotate(" text ", x= 9 , y= 20 , label=" Here is my text ") توضح الأمثلة التالية كيفية استخدام بناء الجملة هذا عمليًا. مثال 1: إضافة...
يتم استخدام مخطط QQ، وهو اختصار لعبارة “الكمية الكمية”، لتقييم ما إذا كانت مجموعة البيانات من المحتمل أن تأتي من التوزيع النظري. في معظم الحالات، يتم استخدام هذا النوع من المخططات لتحديد ما إذا كانت مجموعة البيانات تتبع التوزيع الطبيعي أم...
تُستخدم المخططات المتبقية لتقييم ما إذا كانت بقايا نموذج الانحدار موزعة بشكل طبيعي وما إذا كانت تظهر تغايرًا أم لا. لإنشاء قطعة أرض متبقية في ggplot2، يمكنك استخدام بناء الجملة الأساسي التالي: library (ggplot2) ggplot(model, aes(x = .fitted, y = .resid))...