Pandas: 列の値によって dataframe を分割する方法

によるベンジャミン・アンダーソン博士 7月 22, 2023 ガイド 0コメント

次の基本構文を使用して、pandas DataFrame を列値ごとに分割できます。

 #define value to split on
x = 20

#define df1 as DataFrame where 'column_name' is >= 20
df1 = df[df[' column_name '] >= x]

#define df2 as DataFrame where 'column_name' is < 20
df2 = df[df[' column_name '] < x]

次の例は、この構文を実際に使用する方法を示しています。

例: Pandas DataFrame を列値で分割する

次のパンダデータフレームがあるとします。

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' points ': [22, 24, 19, 18, 14, 29, 31, 16],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
print (df)

        team points rebounds
0 to 22 11
1 B 24 8
2 C 19 10
3 D 18 6
4 E 14 6
5 F 29 5
6 G 31 9
7:16:12

次のコードを使用して、DataFrame を 2 つの DataFrame に分割できます。最初の DataFrame には「ポイント」が 20 以上の行が含まれ、2 番目の DataFrame には「ポイント」が 20 未満の行が含まれます。

 #define value to split on
x = 20

#define df1 as DataFrame where 'points' is >= 20
df1 = df[df[' points '] >= x]

print (df1)

  team points rebounds
0 to 22 11
1 B 24 8
5 F 29 5
6 G 31 9

#define df2 as DataFrame where 'points' is < 20
df2 = df[df[' points '] < x]

print (df2)

  team points rebounds
2 C 19 10
3 D 18 6
4 E 14 6
7:16:12

また、 reset_index()関数を使用して、結果の各データフレームのインデックス値をリセットすることもできることに注意してください。

 #define value to split on
x = 20

#define df1 as DataFrame where 'points' is >= 20
df1 = df[df[' points '] >= x]. reset_index (drop= True )

print (df1)

  team points rebounds
0 to 22 11
1 B 24 8
2 F 29 5
3 G 31 9

#define df2 as DataFrame where 'points' is < 20
df2 = df[df[' points '] < x]. reset_index (drop= True )

print (df2)

  team points rebounds
0 C 19 10
1 D 18 6
2 E 14 6
3:16:12

結果として得られる各 DataFrame のインデックスは 0 から始まることに注意してください。

追加リソース

次のチュートリアルでは、Python の他の一般的なエラーを修正する方法を説明します。

パンダの KeyError を修正する方法
 修正方法: ValueError: float NaN を int に変換できません
 修正方法: ValueError: オペランドをシェイプでブロードキャストできませんでした

著者について

ベンジャミン・アンダーソン博士

私はベンジャミンです。退職した統計教授から、専任の Statorials 教育者になりました。統計分野における豊富な経験と専門知識を活かして、私は Statorials を通じて学生に力を与えるために自分の知識を共有することに尽力しています。もっと知る

例: Pandas DataFrame を列値で分割する

追加リソース

著者について

ベンジャミン・アンダーソン博士

コメントを追加する