Cara membuat dataframe 3d pandas (dengan contoh)
Anda dapat menggunakan modul xarray untuk membuat DataFrame panda 3D dengan cepat.
Tutorial ini menjelaskan cara membuat DataFrame 3D panda berikut menggunakan fungsi modul xarray:
product_A product_B product_C
year quarter
2021 Q1 1.624345 0.319039 50
Q2 -0.611756 0.319039 50
Q3 -0.528172 0.319039 50
Q4 -1.072969 0.319039 50
2022 Q1 0.865408 -0.249370 50
Q2 -2.301539 -0.249370 50
Q3 1.744812 -0.249370 50
Q4 -0.761207 -0.249370 50
Contoh: Membuat DataFrame 3D Pandas
Kode berikut menunjukkan cara membuat dataset 3D menggunakan fungsi xarray dan NumPy :
import numpy as np
import xarray as xr
#make this example reproducible
n.p. random . seeds (1)
#create 3D dataset
xarray_3d = xr. Dataset (
{ " product_A ": (("year", "quarter"), np.random.randn (2,4))},
coordinates={
" year ": [2021, 2022],
" quarter ": ["Q1", "Q2", "Q3", "Q4"],
" product_B ": ("year", np. random . randn (2)),
" product_C ": 50,
},
)
#view 3D dataset
print (xarray_3d)
Dimensions: (year: 2, quarter: 4)
Coordinates:
* year (year) int32 2021 2022
* quarter (quarter) <U2 'Q1' 'Q2' 'Q3' 'Q4'
product_B (year) float64 0.319 -0.2494
product_C int32 50
Data variables:
product_A (year, quarter) float64 1.624 -0.6118 -0.5282 ... 1.745 -0.7612
Catatan : Fungsi NumPy randn() mengembalikan nilai contoh dari distribusi normal standar .
Kita kemudian dapat menggunakan fungsi to_dataframe() untuk mengubah kumpulan data ini menjadi DataFrame pandas:
#convert xarray to DataFrame
df_3d = xarray_3d. to_dataframe ()
#view 3D DataFrame
print (df_3d)
product_A product_B product_C
year quarter
2021 Q1 1.624345 0.319039 50
Q2 -0.611756 0.319039 50
Q3 -0.528172 0.319039 50
Q4 -1.072969 0.319039 50
2022 Q1 0.865408 -0.249370 50
Q2 -2.301539 -0.249370 50
Q3 1.744812 -0.249370 50
Q4 -0.761207 -0.249370 50
Hasilnya adalah DataFrame panda 3D yang berisi informasi tentang jumlah penjualan yang dilakukan dari tiga produk berbeda dalam dua tahun berbeda dan empat kuartal berbeda per tahun.
Kita dapat menggunakan fungsi type() untuk mengonfirmasi bahwa objek ini memang merupakan DataFrame pandas:
#display type of df_3d
type (df_3d)
pandas.core.frame.DataFrame
Objek tersebut memang merupakan DataFrame pandas.
Sumber daya tambahan
Tutorial berikut menjelaskan cara menjalankan fungsi umum lainnya di panda:
Pandas: Cara menemukan nilai unik dalam kolom
Pandas: cara mencari perbedaan antara dua garis
Pandas: Cara menghitung nilai yang hilang di DataFrame