Cara membuat dataframe 3d pandas (dengan contoh)


Anda dapat menggunakan modul xarray untuk membuat DataFrame panda 3D dengan cepat.

Tutorial ini menjelaskan cara membuat DataFrame 3D panda berikut menggunakan fungsi modul xarray:

 product_A product_B product_C
year quarter                                 
2021 Q1 1.624345 0.319039 50
     Q2 -0.611756 0.319039 50
     Q3 -0.528172 0.319039 50
     Q4 -1.072969 0.319039 50
2022 Q1 0.865408 -0.249370 50
     Q2 -2.301539 -0.249370 50
     Q3 1.744812 -0.249370 50
     Q4 -0.761207 -0.249370 50

Contoh: Membuat DataFrame 3D Pandas

Kode berikut menunjukkan cara membuat dataset 3D menggunakan fungsi xarray dan NumPy :

 import numpy as np
import xarray as xr

#make this example reproducible
n.p. random . seeds (1)

#create 3D dataset
xarray_3d = xr. Dataset (
    { " product_A ": (("year", "quarter"), np.random.randn (2,4))},
    coordinates={
        " year ": [2021, 2022],
        " quarter ": ["Q1", "Q2", "Q3", "Q4"],
        " product_B ": ("year", np. random . randn (2)),
        " product_C ": 50,
    },
)

#view 3D dataset
print (xarray_3d)

Dimensions: (year: 2, quarter: 4)
Coordinates:
  * year (year) int32 2021 2022
  * quarter (quarter) <U2 'Q1' 'Q2' 'Q3' 'Q4'
    product_B (year) float64 0.319 -0.2494
    product_C int32 50
Data variables:
    product_A (year, quarter) float64 1.624 -0.6118 -0.5282 ... 1.745 -0.7612

Catatan : Fungsi NumPy randn() mengembalikan nilai contoh dari distribusi normal standar .

Kita kemudian dapat menggunakan fungsi to_dataframe() untuk mengubah kumpulan data ini menjadi DataFrame pandas:

 #convert xarray to DataFrame
df_3d = xarray_3d. to_dataframe ()

#view 3D DataFrame
print (df_3d)

              product_A product_B product_C
year quarter                                 
2021 Q1 1.624345 0.319039 50
     Q2 -0.611756 0.319039 50
     Q3 -0.528172 0.319039 50
     Q4 -1.072969 0.319039 50
2022 Q1 0.865408 -0.249370 50
     Q2 -2.301539 -0.249370 50
     Q3 1.744812 -0.249370 50
     Q4 -0.761207 -0.249370 50

Hasilnya adalah DataFrame panda 3D yang berisi informasi tentang jumlah penjualan yang dilakukan dari tiga produk berbeda dalam dua tahun berbeda dan empat kuartal berbeda per tahun.

Kita dapat menggunakan fungsi type() untuk mengonfirmasi bahwa objek ini memang merupakan DataFrame pandas:

 #display type of df_3d
type (df_3d)

pandas.core.frame.DataFrame

Objek tersebut memang merupakan DataFrame pandas.

Sumber daya tambahan

Tutorial berikut menjelaskan cara menjalankan fungsi umum lainnya di panda:

Pandas: Cara menemukan nilai unik dalam kolom
Pandas: cara mencari perbedaan antara dua garis
Pandas: Cara menghitung nilai yang hilang di DataFrame

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *