Pandas 3d dataframe을 만드는 방법(예제 포함)


xarray 모듈을 사용하여 3D Pandas DataFrame을 빠르게 생성할 수 있습니다.

이 튜토리얼에서는 xarray 모듈 기능을 사용하여 다음 pandas 3D DataFrame을 생성하는 방법을 설명합니다.

 product_A product_B product_C
year quarter                                 
2021 Q1 1.624345 0.319039 50
     Q2 -0.611756 0.319039 50
     Q3 -0.528172 0.319039 50
     Q4 -1.072969 0.319039 50
2022 Q1 0.865408 -0.249370 50
     Q2 -2.301539 -0.249370 50
     Q3 1.744812 -0.249370 50
     Q4 -0.761207 -0.249370 50

예: Pandas 3D DataFrame 생성

다음 코드는 xarrayNumPy 함수를 사용하여 3D 데이터세트를 생성하는 방법을 보여줍니다.

 import numpy as np
import xarray as xr

#make this example reproducible
n.p. random . seeds (1)

#create 3D dataset
xarray_3d = xr. Dataset (
    { " product_A ": (("year", "quarter"), np.random.randn (2,4))},
    coordinates={
        " year ": [2021, 2022],
        " quarter ": ["Q1", "Q2", "Q3", "Q4"],
        " product_B ": ("year", np. random . randn (2)),
        " product_C ": 50,
    },
)

#view 3D dataset
print (xarray_3d)

Dimensions: (year: 2, quarter: 4)
Coordinates:
  * year (year) int32 2021 2022
  * quarter (quarter) <U2 'Q1' 'Q2' 'Q3' 'Q4'
    product_B (year) float64 0.319 -0.2494
    product_C int32 50
Data variables:
    product_A (year, quarter) float64 1.624 -0.6118 -0.5282 ... 1.745 -0.7612

참고 : NumPy randn() 함수는 표준 정규 분포 의 예제 값을 반환합니다.

그런 다음 to_dataframe() 함수를 사용하여 이 데이터 세트를 pandas DataFrame으로 변환할 수 있습니다.

 #convert xarray to DataFrame
df_3d = xarray_3d. to_dataframe ()

#view 3D DataFrame
print (df_3d)

              product_A product_B product_C
year quarter                                 
2021 Q1 1.624345 0.319039 50
     Q2 -0.611756 0.319039 50
     Q3 -0.528172 0.319039 50
     Q4 -1.072969 0.319039 50
2022 Q1 0.865408 -0.249370 50
     Q2 -2.301539 -0.249370 50
     Q3 1.744812 -0.249370 50
     Q4 -0.761207 -0.249370 50

그 결과는 서로 다른 2년, 연간 4개 분기 동안 세 가지 제품의 판매량에 대한 정보가 포함된 3D pandas DataFrame입니다.

type() 함수를 사용하여 이 개체가 실제로 pandas DataFrame인지 확인할 수 있습니다.

 #display type of df_3d
type (df_3d)

pandas.core.frame.DataFrame

개체는 실제로 pandas DataFrame입니다.

추가 리소스

다음 튜토리얼에서는 Pandas에서 다른 일반적인 기능을 수행하는 방법을 설명합니다.

Pandas: 열에서 고유한 값을 찾는 방법
Pandas: 두 줄의 차이점을 찾는 방법
Pandas: DataFrame에서 누락된 값을 계산하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다