كيفية إجراء الحذف على القائمة في r (مع مثال)


يعد الحذف على مستوى القائمة طريقة تحذف كافة الصفوف الموجودة في إطار البيانات والتي تحتوي على قيمة مفقودة في عمود .

أسهل طريقة لإجراء الحذف على القائمة في R هي استخدام بناء الجملة التالي:

 complete_df <- df[complete. boxes (df), ]

يستخدم بناء الجملة هذا الدالة Complete.cases() لإنشاء إطار بيانات جديد يحتوي فقط على تلك الصفوف من إطار البيانات الأصلي الذي لا يحتوي على قيم مفقودة في أي عمود.

يوضح المثال التالي كيفية استخدام هذه الوظيفة عمليًا.

مثال: قم بإجراء الحذف على القائمة في R

لنفترض أن لدينا إطار البيانات التالي في R الذي يحتوي على معلومات حول لاعبي كرة السلة المختلفين:

 #create data frame
df <- data. frame (rating=c(70, 75, 75, 78, 81, 85, 89, 91, 94, 97),
                 points=c(12, 15, 14, 13, NA, 29, 24, 18, 20, 25),
                 assists=c(9, 5, NA, 5, 7, 8, 11, 12, 13, 11))

#view data frame
df

   rating points assists
1 70 12 9
2 75 15 5
3 75 14 NA
4 78 13 5
5 81 NA 7
6 85 29 8
7 89 24 11
8 91 18 12
9 94 20 13
10 97 25 11

لاحظ أن صفين يحتويان على قيم NA في بعض الأعمدة.

يمكننا استخدام بناء الجملة التالي لإجراء حذف على مستوى القائمة والاحتفاظ فقط بالصفوف التي لا تحتوي على قيم مفقودة في أي عمود:

 #create new data frame that only contains rows with no missing values
complete_df <- df[complete. boxes (df), ]

#view new data frame
complete_df

   rating points assists
1 70 12 9
2 75 15 5
4 78 13 5
6 85 29 8
7 89 24 11
8 91 18 12
9 94 20 13
10 97 25 11

لاحظ أنه لا يحتوي أي من الصفوف الموجودة في إطار البيانات الجديد هذا على قيم فارغة في أي أعمدة.

لاحظ أيضًا أنه يمكننا استخدام الدالة nrow() لتحديد عدد الصفوف في إطار البيانات الأصلي التي تحتوي على قيم مفقودة في أي عمود:

 #count how many rows have missing values in any column
nrow(df[ ! complete. cases (df), ])

[1] 2

يخبرنا هذا أن صفين في إطار البيانات الأصلي يحتويان على قيم مفقودة في عمود واحد على الأقل.

ويمكننا بسهولة حساب عدد الصفوف التي لا تحتوي على قيم مفقودة في أي عمود:

 #count how many rows do not have missing values in any column
nrow(df[complete. cases (df), ])

[1] 8

يخبرنا هذا أن 8 صفوف من إطار البيانات الأصلي لا تحتوي على قيم مفقودة في أي أعمدة.

مصادر إضافية

تشرح البرامج التعليمية التالية كيفية تنفيذ المهام الشائعة الأخرى في R:

كيفية البحث عن القيم المفقودة وحسابها في R
كيفية استيفاء القيم المفقودة في R

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *