الباندا: كيفية استخدام dropna() مع أعمدة محددة


يمكنك استخدام الدالة dropna() مع وسيطة المجموعة الفرعية لإزالة الصفوف من pandas DataFrame التي تحتوي على قيم مفقودة في أعمدة محددة.

فيما يلي الطرق الأكثر شيوعًا لاستخدام هذه الميزة عمليًا:

الطريقة الأولى: إزالة الصفوف ذات القيم المفقودة في عمود معين

 df. dropna (subset = [' column1 '], inplace= True )

الطريقة الثانية: إزالة الصفوف ذات القيم المفقودة في أحد الأعمدة المحددة المتعددة

 df. dropna (subset = [' column1 ', ' column2 ', ' column3 '], inplace= True )

توضح الأمثلة التالية كيفية استخدام كل طريقة عمليًا مع الباندا DataFrame التالية:

 import pandas as pd
import numpy as np

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' points ': [18, np.nan, 19, 14, 14, 11, 20, 28],
                   ' assists ': [5, np.nan, np.nan, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, np.nan]})

#view DataFrame
print (df)

  team points assists rebounds
0 A 18.0 5.0 11.0
1 B NaN NaN 8.0
2 C 19.0 NaN 10.0
3D 14.0 9.0 6.0
4 E 14.0 12.0 6.0
5 F 11.0 9.0 5.0
6G 20.0 9.0 9.0
7H 28.0 4.0 NaN

مثال 1: إزالة الصفوف ذات القيم المفقودة في عمود معين

يمكننا استخدام الصيغة التالية لإزالة الصفوف ذات القيم المفقودة في عمود “المساعدات”:

 #drop rows with missing values in 'assists' column
df. dropna (subset = [' assists '], inplace= True )

#view updated DataFrame
print (df)

  team points assists rebounds
0 A 18.0 5.0 11.0
3D 14.0 9.0 6.0
4 E 14.0 12.0 6.0
5 F 11.0 9.0 5.0
6G 20.0 9.0 9.0
7H 28.0 4.0 NaN

لاحظ أنه تمت إزالة الصفين ذوي القيم المفقودة في عمود “المساعدات” من DataFrame.

لاحظ أيضًا أنه يتم الاحتفاظ بالصف الأخير من DataFrame حتى إذا كان يحتوي على قيمة مفقودة لأن القيمة المفقودة ليست في عمود “المساعدات”.

المثال 2: إزالة الصفوف ذات القيم المفقودة في أحد الأعمدة المحددة المتعددة

يمكننا استخدام الصيغة التالية لإزالة الصفوف ذات القيم المفقودة في أعمدة “النقاط” أو “الارتدادات”:

 #drop rows with missing values in 'points' or 'rebounds' column
df. dropna (subset = [' points ', ' rebounds '], inplace= True )

#view updated DataFrame
print (df)

  team points assists rebounds
0 A 18.0 5.0 11.0
2 C 19.0 NaN 10.0
3D 14.0 9.0 6.0
4 E 14.0 12.0 6.0
5 F 11.0 9.0 5.0
6G 20.0 9.0 9.0

لاحظ أنه تمت إزالة الصفين ذوي القيم المفقودة في أعمدة “النقاط” أو “الارتدادات” من DataFrame.

ملاحظة : يمكنك العثور على الوثائق الكاملة لوظيفة pandas dropna() هنا .

مصادر إضافية

تشرح البرامج التعليمية التالية كيفية تنفيذ المهام الشائعة الأخرى في الباندا:

الباندا: كيفية إعادة ضبط الفهرس بعد استخدام dropna()
الباندا: كيفية إزالة الأعمدة ذات قيم NaN
الباندا: كيفية حذف الصفوف بناءً على شروط متعددة

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *