Jak policzyć brakujące wartości w pandas dataframe
Często możesz chcieć policzyć liczbę brakujących wartości w ramce DataFrame pandy.
W tym samouczku pokazano kilka przykładów liczenia brakujących wartości przy użyciu następującej ramki DataFrame:
import pandas as pd import numpy as np #create DataFrame with some missing values df = pd.DataFrame({'a': [4, np.nan, np.nan, 7, 8, 12], 'b': [np.nan, 6, 8, 14, 29, np.nan], 'c': [11, 8, 10, 6, 6, np.nan]}) #view DataFrame print (df) ABC 0 4.0 NaN 11.0 1 NaN 6.0 8.0 2 NaN 8.0 10.0 3 7.0 14.0 6.0 4 8.0 29.0 6.0 5 12.0 NaN NaN
Policz wszystkie brakujące wartości w całej DataFrame
Poniższy kod pokazuje, jak obliczyć całkowitą liczbę brakujących wartości w całej DataFrame:
df. isnull (). sum (). sum () 5
To mówi nam, że w sumie brakuje 5 wartości.
Policz całkowite brakujące wartości w kolumnie
Poniższy kod pokazuje, jak obliczyć całkowitą liczbę brakujących wartości w każdej kolumnie DataFrame:
df. isnull (). sum () at 2 b 2 c 1
To nam mówi:
- Kolumna „a” zawiera 2 brakujące wartości.
- Kolumna „b” zawiera 2 brakujące wartości.
- W kolumnie „c” brakuje 1 wartości.
Możesz także wyświetlić liczbę brakujących wartości jako procent całej kolumny:
df. isnull (). sum ()/ len (df)* 100 a 33.333333 b 33.333333 c 16.666667
To nam mówi:
- Brakuje 33,33% wartości w kolumnie „a”.
- Brakuje 33,33% wartości w kolumnie „b”.
- Brakuje 16,67% wartości w kolumnie „c”.
Policz całkowite brakujące wartości w każdym wierszu
Poniższy kod pokazuje, jak obliczyć całkowitą liczbę brakujących wartości w każdym wierszu DataFrame:
df. isnull (). sum (axis= 1 ) 0 1 1 1 2 1 30 4 0 5 2
To nam mówi:
- W wierszu 1 brakuje 1 wartości.
- W wierszu 2 brakuje 1 wartości.
- W wierszu 3 brakuje 1 wartości.
- Linia 4 zawiera 0 brakujących wartości.
- Linia 5 zawiera 0 brakujących wartości.
- Linia 6 zawiera 2 brakujące wartości.
Dodatkowe zasoby
Jak znaleźć unikalne wartości w wielu kolumnach w Pandach
Jak utworzyć nową kolumnę na podstawie warunku w Pandach