Panda's: hoe nan-waarden vullen met gemiddelde (3 voorbeelden)

Von Dr.benjamin anderson Juli 21, 2023 Gids Keine Kommentare

U kunt de functie fillna() gebruiken om NaN-waarden in een pandas DataFrame te vervangen.

Hier zijn drie veelvoorkomende manieren om deze functie te gebruiken:

Methode 1: Vul NaN-waarden in een kolom met het gemiddelde

 df[' col1 '] = df[' col1 ']. fillna (df[' col1 ']. mean ())

Methode 2: Vul NaN-waarden in meerdere kolommen met gemiddelde

 df[[' col1 ', ' col2 ']] = df[[' col1 ', ' col2 ']]. fillna (df[[' col1 ',' col2 ']]. mean ())

Methode 3: Vul NaN-waarden in alle kolommen in met gemiddelde

 df = df. fillna ( df.mean ())

De volgende voorbeelden laten zien hoe u elke methode in de praktijk kunt gebruiken met de volgende panda’s DataFrame:

 import numpy as np
import pandas as pd

#create DataFrame with some NaN values
df = pd. DataFrame ({' rating ': [np.nan, 85, np.nan, 88, 94, 90, 76, 75, 87, 86],
                   ' points ': [25, np.nan, 14, 16, 27, 20, 12, 15, 14, 19],
                   ' assists ': [5, 7, 7, np.nan, 5, 7, 6, 9, 9, 5],
                   ' rebounds ': [11, 8, 10, 6, 6, 9, 6, 10, 10, 7]})

#view DataFrame
df

        rating points assists rebounds
0 NaN 25.0 5.0 11
1 85.0 NaN 7.0 8
2 NaN 14.0 7.0 10
3 88.0 16.0 NaN 6
4 94.0 27.0 5.0 6
5 90.0 20.0 7.0 9
6 76.0 12.0 6.0 6
7 75.0 15.0 9.0 10
8 87.0 14.0 9.0 10
9 86.0 19.0 5.0 7

Voorbeeld 1: Vul NaN-waarden in een kolom met het gemiddelde

De volgende code laat zien hoe je de NaN-waarden in de beoordelingskolom vult met de gemiddelde waarde van de beoordelingskolom :

 #fill NaNs with column mean in 'rating' column
df[' rating '] = df[' rating ']. fillna (df[' rating ']. mean ())

#view updated DataFrame
df

	rating points assists rebounds
0 85.125 25.0 5.0 11
1 85,000 NaN 7.0 8
2 85.125 14.0 7.0 10
3 88,000 16.0 NaN 6
4 94,000 27.0 5.0 6
5 90,000 20.0 7.0 9
6 76,000 12.0 6.0 6
7 75,000 15.0 9.0 10
8 87,000 14.0 9.0 10
9 86,000 19.0 5.0 7

De gemiddelde waarde in de beoordelingskolom was 85.125 , dus elk van de NaN-waarden in de beoordelingskolom was met die waarde gevuld.

Voorbeeld 2: Vul NaN-waarden in meerdere kolommen met het gemiddelde

De volgende code laat zien hoe u de NaN-waarden in de beoordelings- en puntenkolommen kunt invullen met hun respectievelijke kolomgemiddelden:

 #fill NaNs with column means in 'rating' and 'points' columns
df[[' rating ', ' points ']] = df[[' rating ', ' points ']]. fillna (df[[' rating ',' points ']]. mean ())

#view updated DataFrame
df

	rating points assists rebounds
0 85.125 25.0 5.0 11
1 85,000 18.0 7.0 8
2 85.125 14.0 7.0 10
3 88,000 16.0 NaN 6
4 94,000 27.0 5.0 6
5 90,000 20.0 7.0 9
6 76,000 12.0 6.0 6
7 75,000 15.0 9.0 10
8 87,000 14.0 9.0 10
9 86,000 19.0 5.0 7

De NaN-waarden in de cijfer- en puntkolommen zijn gevuld met hun respectieve kolomgemiddelden.

Voorbeeld 3: Vul de NaN-waarden in alle kolommen met het gemiddelde

De volgende code laat zien hoe je de NaN-waarden in elke kolom vult met de kolomgemiddelden:

 #fill NaNs with column means in each column 
df = df. fillna ( df.mean ())

#view updated DataFrame
df

        rating points assists rebounds
0 85.125 25.0 5.000000 11
1 85,000 18.0 7,000000 8
2 85.125 14.0 7.000000 10
3 88,000 16.0 6.666667 6
4 94,000 27.0 5,000000 6
5 90,000 20.0 7,000000 9
6 76,000 12.0 6,000000 6
7 75,000 15.0 9,000000 10
8 87,000 14.0 9,000000 10
9 86,000 19.0 5,000000 7

Merk op dat de NaN-waarden in elke kolom zijn gevuld met het gemiddelde van hun kolom.

U kunt hier de volledige online documentatie voor de functie fillna() vinden.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende bewerkingen in panda’s kunt uitvoeren:

Hoe ontbrekende waarden bij panda’s te tellen
Hoe rijen met NaN-waarden in Panda’s te verwijderen
Hoe rijen met een specifieke waarde in Pandas te verwijderen

Über den Autor

Dr.benjamin anderson

Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder