So erstellen sie einen pandas 3d dataframe (mit beispiel)


Mit dem xarray- Modul können Sie schnell einen 3D-Pandas-DataFrame erstellen.

In diesem Tutorial wird erklärt, wie Sie mit den Funktionen des xarray-Moduls den folgenden Pandas 3D DataFrame erstellen:

 product_A product_B product_C
year quarter                                 
2021 Q1 1.624345 0.319039 50
     Q2 -0.611756 0.319039 50
     Q3 -0.528172 0.319039 50
     Q4 -1.072969 0.319039 50
2022 Q1 0.865408 -0.249370 50
     Q2 -2.301539 -0.249370 50
     Q3 1.744812 -0.249370 50
     Q4 -0.761207 -0.249370 50

Beispiel: Erstellen Sie einen Pandas 3D DataFrame

Der folgende Code zeigt, wie man mit xarray- und NumPy -Funktionen einen 3D-Datensatz erstellt:

 import numpy as np
import xarray as xr

#make this example reproducible
n.p. random . seeds (1)

#create 3D dataset
xarray_3d = xr. Dataset (
    { " product_A ": (("year", "quarter"), np.random.randn (2,4))},
    coordinates={
        " year ": [2021, 2022],
        " quarter ": ["Q1", "Q2", "Q3", "Q4"],
        " product_B ": ("year", np. random . randn (2)),
        " product_C ": 50,
    },
)

#view 3D dataset
print (xarray_3d)

Dimensions: (year: 2, quarter: 4)
Coordinates:
  * year (year) int32 2021 2022
  * quarter (quarter) <U2 'Q1' 'Q2' 'Q3' 'Q4'
    product_B (year) float64 0.319 -0.2494
    product_C int32 50
Data variables:
    product_A (year, quarter) float64 1.624 -0.6118 -0.5282 ... 1.745 -0.7612

Hinweis : Die Funktion NumPy randn() gibt Beispielwerte aus der Standardnormalverteilung zurück.

Anschließend können wir die Funktion to_dataframe() verwenden, um diesen Datensatz in einen Pandas-DataFrame umzuwandeln:

 #convert xarray to DataFrame
df_3d = xarray_3d. to_dataframe ()

#view 3D DataFrame
print (df_3d)

              product_A product_B product_C
year quarter                                 
2021 Q1 1.624345 0.319039 50
     Q2 -0.611756 0.319039 50
     Q3 -0.528172 0.319039 50
     Q4 -1.072969 0.319039 50
2022 Q1 0.865408 -0.249370 50
     Q2 -2.301539 -0.249370 50
     Q3 1.744812 -0.249370 50
     Q4 -0.761207 -0.249370 50

Das Ergebnis ist ein 3D-Pandas-DataFrame, der Informationen über die Anzahl der Verkäufe von drei verschiedenen Produkten in zwei verschiedenen Jahren und vier verschiedenen Quartalen pro Jahr enthält.

Wir können die Funktion type() verwenden, um zu bestätigen, dass es sich bei diesem Objekt tatsächlich um einen Pandas-DataFrame handelt:

 #display type of df_3d
type (df_3d)

pandas.core.frame.DataFrame

Das Objekt ist tatsächlich ein Pandas-DataFrame.

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie andere allgemeine Funktionen in Pandas ausgeführt werden:

Pandas: So finden Sie eindeutige Werte in einer Spalte
Pandas: So finden Sie den Unterschied zwischen zwei Linien
Pandas: So zählen Sie fehlende Werte in DataFrame

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert