Pandalar: dropna()'nın belirli sütunlarla nasıl kullanılacağı


Belirli sütunlarda eksik değerler içeren bir pandas DataFrame’den satırları kaldırmak için dropna() işlevini subset argümanıyla birlikte kullanabilirsiniz.

Bu özelliği pratikte kullanmanın en yaygın yolları şunlardır:

Yöntem 1: Belirli bir sütunda eksik değerleri olan satırları kaldırın

 df. dropna (subset = [' column1 '], inplace= True )

Yöntem 2: Birkaç belirli sütundan birinde eksik değerleri olan satırları kaldırın

 df. dropna (subset = [' column1 ', ' column2 ', ' column3 '], inplace= True )

Aşağıdaki örnekler, her yöntemin pratikte aşağıdaki pandalar DataFrame ile nasıl kullanılacağını gösterir:

 import pandas as pd
import numpy as np

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' points ': [18, np.nan, 19, 14, 14, 11, 20, 28],
                   ' assists ': [5, np.nan, np.nan, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, np.nan]})

#view DataFrame
print (df)

  team points assists rebounds
0 A 18.0 5.0 11.0
1 B NaN NaN 8.0
2 C 19.0 NaN 10.0
3D 14.0 9.0 6.0
4 E 14.0 12.0 6.0
5 F 11.0 9.0 5.0
6G 20.0 9.0 9.0
7H 28.0 4.0 NaN

Örnek 1: Belirli bir sütunda eksik değerleri olan satırları kaldırın

“Yardımlar” sütununda eksik değerlerin bulunduğu satırları kaldırmak için aşağıdaki sözdizimini kullanabiliriz:

 #drop rows with missing values in 'assists' column
df. dropna (subset = [' assists '], inplace= True )

#view updated DataFrame
print (df)

  team points assists rebounds
0 A 18.0 5.0 11.0
3D 14.0 9.0 6.0
4 E 14.0 12.0 6.0
5 F 11.0 9.0 5.0
6G 20.0 9.0 9.0
7H 28.0 4.0 NaN

“Assists” sütunundaki eksik değerlerin bulunduğu iki satırın da DataFrame’den kaldırıldığını unutmayın.

Ayrıca, eksik değer “yardımlar” sütununda olmadığından, eksik bir değere sahip olsa bile DataFrame’in son satırının korunduğunu unutmayın.

Örnek 2: Birkaç belirli sütundan birinde eksik değerleri olan satırları kaldırın

“Noktalar” veya “geri dönenler” sütunlarındaki eksik değerlerin bulunduğu satırları kaldırmak için aşağıdaki sözdizimini kullanabiliriz:

 #drop rows with missing values in 'points' or 'rebounds' column
df. dropna (subset = [' points ', ' rebounds '], inplace= True )

#view updated DataFrame
print (df)

  team points assists rebounds
0 A 18.0 5.0 11.0
2 C 19.0 NaN 10.0
3D 14.0 9.0 6.0
4 E 14.0 12.0 6.0
5 F 11.0 9.0 5.0
6G 20.0 9.0 9.0

“Noktalar” veya “geri dönenler” sütunlarında eksik değerlerin bulunduğu iki satırın DataFrame’den kaldırıldığını unutmayın.

Not : Pandas dropna() işlevine ilişkin tüm belgeleri burada bulabilirsiniz.

Ek kaynaklar

Aşağıdaki eğitimlerde pandalarda diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:

Pandalar: Dropna() kullanıldıktan sonra indeks nasıl sıfırlanır?
Pandalar: NaN değerlerine sahip sütunlar nasıl kaldırılır
Pandalar: Birden çok koşula dayalı satırlar nasıl silinir?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir