Jak policzyć brakujące wartości w pandas dataframe


Często możesz chcieć policzyć liczbę brakujących wartości w ramce DataFrame pandy.

W tym samouczku pokazano kilka przykładów liczenia brakujących wartości przy użyciu następującej ramki DataFrame:

 import pandas as pd
import numpy as np

#create DataFrame with some missing values
df = pd.DataFrame({'a': [4, np.nan, np.nan, 7, 8, 12],
                   'b': [np.nan, 6, 8, 14, 29, np.nan],
                   'c': [11, 8, 10, 6, 6, np.nan]})

#view DataFrame
print (df)

      ABC
0 4.0 NaN 11.0
1 NaN 6.0 8.0
2 NaN 8.0 10.0
3 7.0 14.0 6.0
4 8.0 29.0 6.0
5 12.0 NaN NaN

Policz wszystkie brakujące wartości w całej DataFrame

Poniższy kod pokazuje, jak obliczyć całkowitą liczbę brakujących wartości w całej DataFrame:

 df. isnull (). sum (). sum ()

5

To mówi nam, że w sumie brakuje 5 wartości.

Policz całkowite brakujące wartości w kolumnie

Poniższy kod pokazuje, jak obliczyć całkowitą liczbę brakujących wartości w każdej kolumnie DataFrame:

 df. isnull (). sum ()

at 2
b 2
c 1

To nam mówi:

  • Kolumna „a” zawiera 2 brakujące wartości.
  • Kolumna „b” zawiera 2 brakujące wartości.
  • W kolumnie „c” brakuje 1 wartości.

Możesz także wyświetlić liczbę brakujących wartości jako procent całej kolumny:

 df. isnull (). sum ()/ len (df)* 100

a 33.333333
b 33.333333
c 16.666667

To nam mówi:

  • Brakuje 33,33% wartości w kolumnie „a”.
  • Brakuje 33,33% wartości w kolumnie „b”.
  • Brakuje 16,67% wartości w kolumnie „c”.

Policz całkowite brakujące wartości w każdym wierszu

Poniższy kod pokazuje, jak obliczyć całkowitą liczbę brakujących wartości w każdym wierszu DataFrame:

 df. isnull (). sum (axis= 1 )

0 1
1 1
2 1
30
4 0
5 2

To nam mówi:

  • W wierszu 1 brakuje 1 wartości.
  • W wierszu 2 brakuje 1 wartości.
  • W wierszu 3 brakuje 1 wartości.
  • Linia 4 zawiera 0 brakujących wartości.
  • Linia 5 zawiera 0 brakujących wartości.
  • Linia 6 zawiera 2 brakujące wartości.

Dodatkowe zasoby

Jak znaleźć unikalne wartości w wielu kolumnach w Pandach
Jak utworzyć nową kolumnę na podstawie warunku w Pandach

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *