パンダ: 一意の値を見つけて nan を無視する方法

によるベンジャミン・アンダーソン博士 7月 12, 2023 ガイド 0コメント

次のカスタム関数を定義して、パンダで一意の値を検索し、NaN 値を無視することができます。

 def unique_no_nan(x):
    return x. dropna (). single ()

この関数は、NaN 値を除くすべての一意の値を含む pandas シリーズを返します。

次の例は、次の pandas DataFrame を使用したさまざまなシナリオでこの関数を使用する方法を示しています。

 import pandas as pd
import numpy as np

#createDataFrame
df = pd. DataFrame ({' team ': ['Mavs', 'Mavs', 'Mavs', 'Celtics', 'Celtics', 'Celtics'],
                   ' points ': [95, 95, 100, 113, 100, np.nan]})

#view DataFrame
print (df)

      team points
0 Mavs 95.0
1 Mavs 95.0
2 Mavs 100.0
3 Celtics 113.0
4 Celtics 100.0
5 Celtics NaN

例 1: Pandas 列で一意の値を検索し、NaN 値を無視する

pandas unique()関数を使用して、DataFrame のポイント列にすべての一意の値を表示するとします。

 #display unique values in 'points' column
df[' points ']. single ()

array([ 95., 100., 113., no])

unique()関数の結果にはデフォルトでnanが含まれることに注意してください。

ただし、代わりにカスタムunique_no_nan()関数を使用して、ポイント列に一意の値を表示するとします。

 #display unique values in 'points' column and ignore NaN
unique_no_nan(df[' points '])

array([ 95., 100., 113.])

この関数は、NaN を除く、ポイント列内のすべての一意の値を返します。

例 2: Pandas Groupby で一意の値を検索し、NaN 値を無視する

pandas のgroupby() 関数とagg()関数を使用して、チーム列ごとにグループ化されたポイント列のすべての一意の値を表示するとします。

 #display unique values in 'points' column grouped by team
df. groupby (' team ')[' points ']. agg ([' single '])

	unique
team	
Celtics [113.0, 100.0, nah]
Mavs [95.0, 100.0]

unique()関数の結果にはデフォルトでnanが含まれることに注意してください。

ただし、代わりにカスタムunique_no_nan()関数を使用して、チーム列ごとにグループ化されたポイント列の一意の値を表示するとします。

 #display unique values in 'points' column grouped by team and ignore NaN
df. groupby (' team ')[' points ']. apply ( lambda x: unique_no_nan(x))

team
Celtics [113.0, 100.0]
Mavs [95.0, 100.0]
Name: points, dtype: object

この関数は、NaN 値をカウントせずに、各チームのポイント列のすべての一意の値を返します。

追加リソース

次のチュートリアルでは、パンダで他の一般的な機能を実行する方法を説明します。

パンダ: DataFrame で単一行を選択する方法
 Pandas: インデックス列から一意の値を取得する方法
 パンダ: 2 つの列の一意の組み合わせを数える方法

著者について

ベンジャミン・アンダーソン博士

私はベンジャミンです。退職した統計教授から、専任の Statorials 教育者になりました。統計分野における豊富な経験と専門知識を活かして、私は Statorials を通じて学生に力を与えるために自分の知識を共有することに尽力しています。もっと知る

例 1: Pandas 列で一意の値を検索し、NaN 値を無視する

例 2: Pandas Groupby で一意の値を検索し、NaN 値を無視する

追加リソース

著者について

ベンジャミン・アンダーソン博士

コメントを追加する