Pandas 3d dataframe の作成方法 (例付き)
xarrayモジュールを使用すると、3D pandas DataFrame をすばやく作成できます。
このチュートリアルでは、xarray モジュール関数を使用して次の pandas 3D DataFrame を作成する方法を説明します。
product_A product_B product_C
year quarter
2021 Q1 1.624345 0.319039 50
Q2 -0.611756 0.319039 50
Q3 -0.528172 0.319039 50
Q4 -1.072969 0.319039 50
2022 Q1 0.865408 -0.249370 50
Q2 -2.301539 -0.249370 50
Q3 1.744812 -0.249370 50
Q4 -0.761207 -0.249370 50
例: Pandas 3D データフレームを作成する
次のコードは、 xarray 関数とNumPy関数を使用して 3D データセットを作成する方法を示しています。
import numpy as np
import xarray as xr
#make this example reproducible
n.p. random . seeds (1)
#create 3D dataset
xarray_3d = xr. Dataset (
{ " product_A ": (("year", "quarter"), np.random.randn (2,4))},
coordinates={
" year ": [2021, 2022],
" quarter ": ["Q1", "Q2", "Q3", "Q4"],
" product_B ": ("year", np. random . randn (2)),
" product_C ": 50,
},
)
#view 3D dataset
print (xarray_3d)
Dimensions: (year: 2, quarter: 4)
Coordinates:
* year (year) int32 2021 2022
* quarter (quarter) <U2 'Q1' 'Q2' 'Q3' 'Q4'
product_B (year) float64 0.319 -0.2494
product_C int32 50
Data variables:
product_A (year, quarter) float64 1.624 -0.6118 -0.5282 ... 1.745 -0.7612
注: NumPy randn()関数は、 標準正規分布からサンプル値を返します。
次に、 to_dataframe()関数を使用して、このデータセットを pandas DataFrame に変換できます。
#convert xarray to DataFrame
df_3d = xarray_3d. to_dataframe ()
#view 3D DataFrame
print (df_3d)
product_A product_B product_C
year quarter
2021 Q1 1.624345 0.319039 50
Q2 -0.611756 0.319039 50
Q3 -0.528172 0.319039 50
Q4 -1.072969 0.319039 50
2022 Q1 0.865408 -0.249370 50
Q2 -2.301539 -0.249370 50
Q3 1.744812 -0.249370 50
Q4 -0.761207 -0.249370 50
結果は、2 つの異なる年と 1 年の異なる 4 つの四半期における 3 つの異なる製品の販売数に関する情報を含む 3D pandas DataFrame です。
type()関数を使用して、このオブジェクトが実際に pandas DataFrame であることを確認できます。
#display type of df_3d
type (df_3d)
pandas.core.frame.DataFrame
このオブジェクトは確かに pandas DataFrame です。
追加リソース
次のチュートリアルでは、パンダで他の一般的な機能を実行する方法を説明します。
パンダ: 列内で一意の値を見つける方法
パンダ: 2 つの線の違いを見つける方法
パンダ: DataFrame の欠損値を数える方法