Pandas: so füllen sie nan-werte mit dem durchschnitt (3 beispiele)

Von Dr. Benjamin Anderson Juli 21, 2023 Führung Keine Kommentare

Sie können die Funktion fillna() verwenden, um NaN-Werte in einem Pandas-DataFrame zu ersetzen.

Hier sind drei gängige Möglichkeiten, diese Funktion zu verwenden:

Methode 1: NaN-Werte in einer Spalte mit dem Durchschnitt füllen

 df[' col1 '] = df[' col1 ']. fillna (df[' col1 ']. mean ())

Methode 2: NaN-Werte in mehreren Spalten mit Durchschnitt füllen

 df[[' col1 ', ' col2 ']] = df[[' col1 ', ' col2 ']]. fillna (df[[' col1 ',' col2 ']]. mean ())

Methode 3: NaN-Werte in allen Spalten mit Durchschnitt füllen

 df = df. fillna ( df.mean ())

Die folgenden Beispiele zeigen, wie jede Methode in der Praxis mit dem folgenden Pandas DataFrame verwendet wird:

 import numpy as np
import pandas as pd

#create DataFrame with some NaN values
df = pd. DataFrame ({' rating ': [np.nan, 85, np.nan, 88, 94, 90, 76, 75, 87, 86],
                   ' points ': [25, np.nan, 14, 16, 27, 20, 12, 15, 14, 19],
                   ' assists ': [5, 7, 7, np.nan, 5, 7, 6, 9, 9, 5],
                   ' rebounds ': [11, 8, 10, 6, 6, 9, 6, 10, 10, 7]})

#view DataFrame
df

        rating points assists rebounds
0 NaN 25.0 5.0 11
1 85.0 NaN 7.0 8
2 NaN 14.0 7.0 10
3 88.0 16.0 NaN 6
4 94.0 27.0 5.0 6
5 90.0 20.0 7.0 9
6 76.0 12.0 6.0 6
7 75.0 15.0 9.0 10
8 87.0 14.0 9.0 10
9 86.0 19.0 5.0 7

Beispiel 1: NaN-Werte in einer Spalte mit dem Durchschnitt füllen

Der folgende Code zeigt, wie die NaN-Werte in der Bewertungsspalte mit dem Durchschnittswert der Bewertungsspalte gefüllt werden:

 #fill NaNs with column mean in 'rating' column
df[' rating '] = df[' rating ']. fillna (df[' rating ']. mean ())

#view updated DataFrame
df

	rating points assists rebounds
0 85.125 25.0 5.0 11
1 85,000 NaN 7.0 8
2 85.125 14.0 7.0 10
3 88,000 16.0 NaN 6
4 94,000 27.0 5.0 6
5 90,000 20.0 7.0 9
6 76,000 12.0 6.0 6
7 75,000 15.0 9.0 10
8 87,000 14.0 9.0 10
9 86,000 19.0 5.0 7

Der Durchschnittswert in der Bewertungsspalte betrug 85,125 , daher wurde jeder der NaN-Werte in der Bewertungsspalte mit diesem Wert gefüllt.

Beispiel 2: NaN-Werte in mehreren Spalten mit dem Durchschnitt füllen

Der folgende Code zeigt, wie die NaN-Werte in den Bewertungs- und Punktespalten mit ihren jeweiligen Spaltendurchschnitten gefüllt werden:

 #fill NaNs with column means in 'rating' and 'points' columns
df[[' rating ', ' points ']] = df[[' rating ', ' points ']]. fillna (df[[' rating ',' points ']]. mean ())

#view updated DataFrame
df

	rating points assists rebounds
0 85.125 25.0 5.0 11
1 85,000 18.0 7.0 8
2 85.125 14.0 7.0 10
3 88,000 16.0 NaN 6
4 94,000 27.0 5.0 6
5 90,000 20.0 7.0 9
6 76,000 12.0 6.0 6
7 75,000 15.0 9.0 10
8 87,000 14.0 9.0 10
9 86,000 19.0 5.0 7

Die NaN-Werte in den Spalten „Note“ und „ Punkt“ wurden mit den jeweiligen Spaltendurchschnitten gefüllt.

Beispiel 3: Füllen Sie die NaN-Werte in allen Spalten mit dem Durchschnitt

Der folgende Code zeigt, wie die NaN-Werte in jeder Spalte mit den Spaltendurchschnitten gefüllt werden:

 #fill NaNs with column means in each column 
df = df. fillna ( df.mean ())

#view updated DataFrame
df

        rating points assists rebounds
0 85.125 25.0 5.000000 11
1 85,000 18.0 7,000000 8
2 85.125 14.0 7.000000 10
3 88,000 16.0 6.666667 6
4 94,000 27.0 5,000000 6
5 90,000 20.0 7,000000 9
6 76,000 12.0 6,000000 6
7 75,000 15.0 9,000000 10
8 87,000 14.0 9,000000 10
9 86,000 19.0 5,000000 7

Beachten Sie, dass die NaN-Werte in jeder Spalte mit dem Durchschnitt ihrer Spalte gefüllt wurden.

Die vollständige Online-Dokumentation zur Funktion fillna() finden Sie hier .

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie andere gängige Vorgänge in Pandas ausgeführt werden:

So zählen Sie fehlende Werte in Pandas
So löschen Sie Zeilen mit NaN-Werten in Pandas
So löschen Sie Zeilen, die einen bestimmten Wert in Pandas enthalten

Über den Autor

Dr. Benjamin Anderson

Hallo, ich bin Benjamin, ein pensionierter Statistikprofessor, der sich zum engagierten Statorials-Lehrer entwickelt hat. Mit umfassender Erfahrung und Fachwissen auf dem Gebiet der Statistik bin ich bestrebt, mein Wissen zu teilen, um Studenten durch Statorials zu befähigen. Mehr wissen