Pandas dataframe をアンピボットする方法 (例あり)

によるベンジャミン・アンダーソン博士 7月 19, 2023 ガイド 0コメント

pandas では、 melt()関数を使用して DataFrame をアンピボットし、ワイドフォーマットからロングフォーマットに変換できます。

この関数は次の基本構文を使用します。

 df_unpivot = pd. melt (df, id_vars=' col1 ', value_vars=[' col2 ', ' col3 ', ...])

金：

id_vars : 識別子として使用する列
value_vars : アンピボットする列

次の例は、この構文を実際に使用する方法を示しています。

例: Pandas DataFrame のピボット解除

次のパンダデータフレームがあるとします。

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E'],
                   ' points ': [18, 22, 19, 14, 14],
                   ' assists ': [5, 7, 7, 9, 12],
                   ' rebounds ': [11, 8, 10, 6, 6]})

#view DataFrame
print (df)

  team points assists rebounds
0 A 18 5 11
1 B 22 7 8
2 C 19 7 10
3 D 14 9 6
4 E 14 12 6

次の構文を使用して、DataFrame を「ピボット解除」できます。

 #unpivot DataFrame from wide format to long format
df_unpivot = pd. melt (df, id_vars=' team ', value_vars=[' points ', ' assists ', ' rebounds '])

#view updated DataFrame
print (df_unpivot)

   team variable value
0 A points 18
1 B points 22
2 C points 19
3 D dots 14
4 E points 14
5 A assists 5
6 B assists 7
7 C assists 7
8 D assists 9
9 E assists 12
10 A rebounds 11
11 B rebounds 8
12 C rebounds 10
13 D rebounds 6
14 E rebounds 6

チーム列を識別子列として使用し、ポイント、アシスト、リバウンドの列をローテーションしないことを選択しました。

結果は長い形式の DataFrame になります。

var_nameおよびvalue_name引数を使用して、回転されていないデータフレーム内の列名を指定することもできることに注意してください。

 #unpivot DataFrame from wide format to long format
df_unpivot = pd. melt (df, id_vars=' team ', value_vars=[' points ', ' assists ', ' rebounds '],
             var_name=' metric ', value_name=' amount ')

#view updated DataFrame
print (df_unpivot)

   team metric amount
0 A points 18
1 B points 22
2 C points 19
3 D dots 14
4 E points 14
5 A assists 5
6 B assists 7
7 C assists 7
8 D assists 9
9 E assists 12
10 A rebounds 11
11 B rebounds 8
12 C rebounds 10
13 D rebounds 6
14 E rebounds 6

新しい列のタイトルがMetricとAmountになっていることに注意してください。

追加リソース

次のチュートリアルでは、Python で他の一般的な操作を実行する方法について説明します。

Pandas DataFrame に行を追加する方法
Pandas DataFrame に列を追加する方法
Pandas DataFrame で特定の値の出現をカウントする方法

著者について

ベンジャミン・アンダーソン博士

私はベンジャミンです。退職した統計教授から、専任の Statorials 教育者になりました。統計分野における豊富な経験と専門知識を活かして、私は Statorials を通じて学生に力を与えるために自分の知識を共有することに尽力しています。もっと知る

例: Pandas DataFrame のピボット解除

追加リソース

著者について

ベンジャミン・アンダーソン博士

コメントを追加する