Panda: come riempire i valori nan con la modalità


È possibile utilizzare la seguente sintassi per sostituire i valori NaN in una colonna di un DataFrame panda con il valore mode della colonna:

 df[' col1 '] = df[' col1 ']. fillna (df[' col1 ']. mode ()[0])

L’esempio seguente mostra come utilizzare questa sintassi nella pratica.

Esempio: sostituisci i valori mancanti con Modalità in Pandas

Supponiamo di avere i seguenti DataFrame panda con alcuni valori mancanti:

 import numpy as np
import pandas as pd

#create DataFrame with some NaN values
df = pd. DataFrame ({' rating ': [np.nan, 85, np.nan, 88, 94, 90, 75, 75, 87, 86],
                   ' points ': [25, np.nan, 14, 16, 27, 20, 12, 15, 14, 19],
                   ' assists ': [5, 7, 7, np.nan, 5, 7, 6, 9, 9, 7],
                   ' rebounds ': [11, 8, 10, 6, 6, 9, 6, 10, 10, 7]})

#view DataFrame
df

        rating points assists rebounds
0 NaN 25.0 5.0 11
1 85.0 NaN 7.0 8
2 NaN 14.0 7.0 10
3 88.0 16.0 NaN 6
4 94.0 27.0 5.0 6
5 90.0 20.0 7.0 9
6 75.0 12.0 6.0 6
7 75.0 15.0 9.0 10
8 87.0 14.0 9.0 10
9 86.0 19.0 7.0 7

Possiamo utilizzare la funzione fillna() per riempire i valori NaN nella colonna rating con il valore mode della colonna rating :

 #fill NaNs with column mode in 'rating' column
df[' rating '] = df[' rating ']. fillna (df[' rating ']. mode ()[0])

#view updated DataFrame
df

	rating points assists rebounds
0 75.0 25.0 5.0 11
1 85.0 NaN 7.0 8
2 75.0 14.0 7.0 10
3 88.0 16.0 NaN 6
4 94.0 27.0 5.0 6
5 90.0 20.0 7.0 9
6 75.0 12.0 6.0 6
7 75.0 15.0 9.0 10
8 87.0 14.0 9.0 10
9 86.0 19.0 7.0 7

Il valore della modalità nella colonna di valutazione era 75 , quindi ciascuno dei valori NaN nella colonna di valutazione è stato popolato con quel valore.

Nota : puoi trovare la documentazione online completa per la funzione fillna() qui .

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre operazioni comuni nei panda:

Come contare i valori mancanti nei panda
Come eliminare righe con valori NaN in Pandas
Come eliminare righe contenenti un valore specifico in Pandas

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *