Cara menghitung nilai yang hilang di pandas dataframe
Seringkali Anda mungkin ingin menghitung jumlah nilai yang hilang dalam pandas DataFrame.
Tutorial ini menunjukkan beberapa contoh cara menghitung nilai yang hilang menggunakan DataFrame berikut:
import pandas as pd import numpy as np #create DataFrame with some missing values df = pd.DataFrame({'a': [4, np.nan, np.nan, 7, 8, 12], 'b': [np.nan, 6, 8, 14, 29, np.nan], 'c': [11, 8, 10, 6, 6, np.nan]}) #view DataFrame print (df) ABC 0 4.0 NaN 11.0 1 NaN 6.0 8.0 2 NaN 8.0 10.0 3 7.0 14.0 6.0 4 8.0 29.0 6.0 5 12.0 NaN NaN
Hitung total nilai yang hilang di seluruh DataFrame
Kode berikut menunjukkan cara menghitung jumlah total nilai yang hilang di seluruh DataFrame:
df. isnull (). sum (). sum () 5
Ini memberitahu kita bahwa ada total 5 nilai yang hilang.
Hitung total nilai yang hilang per kolom
Kode berikut menunjukkan cara menghitung jumlah total nilai yang hilang di setiap kolom DataFrame:
df. isnull (). sum () at 2 b 2 c 1
Ini memberitahu kita:
- Kolom “a” memiliki 2 nilai yang hilang.
- Kolom “b” memiliki 2 nilai yang hilang.
- Kolom “c” memiliki 1 nilai yang hilang.
Anda juga dapat menampilkan jumlah nilai yang hilang sebagai persentase dari keseluruhan kolom:
df. isnull (). sum ()/ len (df)* 100 a 33.333333 b 33.333333 c 16.666667
Ini memberitahu kita:
- 33,33% nilai pada kolom “a” hilang.
- 33,33% nilai pada kolom “b” hilang.
- 16,67% nilai pada kolom “c” hilang.
Hitung total nilai yang hilang per baris
Kode berikut menunjukkan cara menghitung jumlah total nilai yang hilang di setiap baris DataFrame:
df. isnull (). sum (axis= 1 ) 0 1 1 1 2 1 30 4 0 5 2
Ini memberitahu kita:
- Baris 1 memiliki 1 nilai yang hilang.
- Baris 2 memiliki 1 nilai yang hilang.
- Baris 3 memiliki 1 nilai yang hilang.
- Baris 4 memiliki 0 nilai yang hilang.
- Baris 5 memiliki 0 nilai yang hilang.
- Baris 6 memiliki 2 nilai yang hilang.
Sumber daya tambahan
Cara menemukan nilai unik di beberapa kolom di Pandas
Cara membuat kolom baru berdasarkan kondisi di Pandas