Category: مرشد

كيفية حساب تباعد kl في r (مع مثال)

في الإحصاء، يعد تباعد كولباك-ليبلر (KL) مقياسًا للمسافة يحدد الفرق بين توزيعين احتماليين. إذا كان لدينا توزيعان احتماليان، P و Q، فإننا نكتب عمومًا تباعد KL باستخدام الرمز KL(P || Q)، والذي يعني “اختلاف P عن Q”. ونحسبها باستخدام الصيغة التالية:...

كيفية الحصول على أسماء الأعمدة في r (3 طرق)

يمكنك استخدام الطرق التالية للحصول على أسماء الأعمدة لإطار البيانات في R: الطريقة الأولى: الحصول على كافة أسماء الأعمدة colnames(df) الطريقة الثانية: الحصول على أسماء الأعمدة أبجديًا sort(colnames(df)) الطريقة الثالثة: الحصول على أسماء الأعمدة بنوع بيانات محدد colnames(df[,sapply(df, is.numeric )]) توضح...

كيفية رسم المتوسط والانحراف المعياري في ggplot2

في كثير من الأحيان قد ترغب في رسم المتوسط والانحراف المعياري حسب المجموعة في ggplot2. لحسن الحظ، من السهل القيام بذلك باستخدام الدالتين Geom_point() و geom_errorbar() في ggplot2. يوضح المثال التالي كيفية استخدام هذه الوظائف لإنشاء الرسم البياني التالي الذي يوضح...

كيفية حساب الانحراف المعياري حسب المجموعة في r (مع أمثلة)

يمكنك استخدام أي من الطرق التالية لحساب الانحراف المعياري حسب المجموعة في R: الطريقة الأولى: استخدام قاعدة R aggregate(df$col_to_aggregate, list(df$col_to_group_by), FUN=sd) الطريقة الثانية: استخدم dplyr library (dplyr) df %>% group_by(col_to_group_by) %>% summarise_at(vars(col_to_aggregate), list(name=sd)) الطريقة الثالثة: استخدام data.table library (data.table) setDT(df) dt[...

كيفية اختبار التعددية الخطية في r

في تحليل الانحدار، تحدث العلاقة الخطية المتعددة عندما يرتبط متغيران أو أكثر من متغيرات التوقع ارتباطًا وثيقًا ببعضهما البعض، بحيث لا يوفران معلومات فريدة أو مستقلة في نموذج الانحدار. إذا كانت درجة الارتباط عالية بما يكفي بين متغيرات التوقع، فقد يتسبب...

كيفية حذف أعمدة متعددة باستخدام dplyr (مع أمثلة)

يمكنك استخدام أي من الطرق التالية لإزالة أعمدة متعددة من إطار البيانات في R باستخدام حزمة dplyr : 1. قم بإزالة أعمدة متعددة بالاسم df_new <- df %>% select(-c(col2, col4)) 2. قم بإزالة كافة الأعمدة من النطاق df_new <- df %>%...

كيفية رسم خطوط متعددة في ggplot2 (مع مثال)

يمكنك استخدام بناء الجملة الأساسي التالي لرسم أسطر متعددة في ggplot2: ggplot(df, aes(x=x_var, y=y_var)) + geom_line(aes(color=group_var)) + scale_color_manual(name=' legend_title ', labels=c(' lab1 ', ' lab2 ', ' lab3 '), values=c(' color1 ', ' color2 ', ' color3 ')) يقوم بناء الجملة...

كيفية إضافة تسمية إلى geom_hline في ggplot2

يمكنك استخدام بناء الجملة الأساسي التالي لإضافة تسمية إلى خط أفقي في ggplot2: + annotate(" text ", x= 9 , y= 20 , label=" Here is my text ") توضح الأمثلة التالية كيفية استخدام بناء الجملة هذا عمليًا. مثال 1: إضافة...

كيفية إنشاء مؤامرة qq في ggplot2 (مع مثال)

يتم استخدام مخطط QQ، وهو اختصار لعبارة “الكمية الكمية”، لتقييم ما إذا كانت مجموعة البيانات من المحتمل أن تأتي من التوزيع النظري. في معظم الحالات، يتم استخدام هذا النوع من المخططات لتحديد ما إذا كانت مجموعة البيانات تتبع التوزيع الطبيعي أم...

كيفية إنشاء قطعة أرض متبقية في ggplot2 (مع مثال)

تُستخدم المخططات المتبقية لتقييم ما إذا كانت بقايا نموذج الانحدار موزعة بشكل طبيعي وما إذا كانت تظهر تغايرًا أم لا. لإنشاء قطعة أرض متبقية في ggplot2، يمكنك استخدام بناء الجملة الأساسي التالي: library (ggplot2) ggplot(model, aes(x = .fitted, y = .resid))...