Pandasの複数の列にna値を入力する方法


pandas fillna()関数は、pandas DataFrame の列の欠損値を埋めるのに役立ちます。

このチュートリアルでは、この関数を使用して、次の pandas DataFrame の複数の列の欠落値を埋める例をいくつか示します。

 import pandas as pd
import numpy as np

#createDataFrame
df = pd. DataFrame ({'team': ['A', np. nan , 'B', 'B', 'B', 'C', 'C', 'C'],
                   'points': [25, np. no , 15, np. no , 19, 23, 25, 29],
                   'assists': [5, 7, 7, 9, 12, 9, np. no , 4],
                   'rebounds': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
print (df)

  team points assists rebounds
0 A 25.0 5.0 11
1 NaN NaN 7.0 8
2 B 15.0 7.0 10
3 B NaN 9.0 6
4 B 19.0 12.0 6
5 C 23.0 9.0 5
6 C 25.0 NaN 9
7 C 29.0 4.0 12

例1: すべての列の欠損値を埋める

次のコードは、DataFrame 内のすべての列の欠損値をゼロで埋める方法を示しています。

 #replace all missing values with zero
df. fillna (value= 0 ,inplace= True )

#view DataFrame
print (df) 

  team points assists rebounds
0 A 25.0 5.0 11
1 0 0.0 7.0 8
2 B 15.0 7.0 10
3 B 0.0 9.0 6
4 B 19.0 12.0 6
5 C 23.0 9.0 5
6 C 25.0 0.0 9
7 C 29.0 4.0 12

例 2: 複数の列の欠損値を埋める

次のコードは、DataFrame のポイント列とヘルパー列に対してのみ欠損値をゼロで埋める方法を示しています。

 #replace missing values in points and assists columns with zero
df[['points', 'assists']] = df[['points', 'assists']]. fillna (value= 0 )

#view DataFrame
print (df) 

  team points assists rebounds
0 A 25.0 5.0 11
1 NaN 0.0 7.0 8
2 B 15.0 7.0 10
3 B 0.0 9.0 6
4 B 19.0 12.0 6
5 C 23.0 9.0 5
6 C 25.0 0.0 9
7 C 29.0 4.0 12

例 3: 複数の列の欠損値を異なる値で埋める

次のコードは、3 つの異なる列の欠損値を 3 つの異なる値で埋める方法を示しています。

 #replace missing values in three columns with three different values
df. fillna ({'team': ' Unknown ', 'points': 0 , 'assists': ' zero '}, inplace= True )

#view DataFrame
print (df)

      team points assists rebounds
0 A 25.0 5 11
1 Unknown 0.0 7 8
2 B 15.0 7 10
3 B 0.0 9 6
4 B 19.0 12 6
5 C 23.0 9 5
6 C 25.0 zero 9
7 C 29.0 4 12

3 つの列の欠落値がそれぞれ一意の値に置き換えられていることに注意してください。

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です