Como criar um dataframe aninhado no pandas (com exemplo)
Você pode usar a seguinte sintaxe para aninhar vários DataFrames do pandas dentro de outro DataFrame:
df_all = pd. DataFrame ({' idx ':[1,2,3],' dfs ':[df1,df2,df3]})
Este exemplo específico aninha três DataFrames ( df1 , df2 , df3 ) em um DataFrame maior chamado df_all .
Você pode então usar a seguinte sintaxe para acessar um dos DataFrames aninhados específicos:
#display first nested DataFrame print (df_all[' dfs ']. iloc [0])
O exemplo a seguir mostra como usar essa sintaxe na prática.
Exemplo: Crie um DataFrame aninhado no Pandas
Digamos que temos três DataFrames panda:
import pandas as pd #create first DataFrame df1 = pd. DataFrame ({' item ': ['A', 'B', 'C', 'D', 'E'], ' sales ': [18, 22, 19, 14, 30]}) print (df1) item sales 0 to 18 1 B 22 2 C 19 3 D 14 4 E 30 #create second DataFrame df2 = pd. DataFrame ({' item ': ['F', 'G', 'H', 'I', 'J'], ' sales ': [10, 12, 13, 13, 19]}) print (df2) item sales 0 F 10 1 G 12 2:13 a.m. 3 I 13 4 Day 19 #create third DataFrame df3 = pd. DataFrame ({' item ': ['K', 'L', 'M', 'N', 'O'], ' sales ': [41, 22, 28, 25, 18]}) print (df3) item sales 0 K 41 1 L 22 2 M 28 3 N 25 4 O 18
Agora digamos que queremos criar um DataFrame grande para armazenar esses três DataFrames.
Podemos usar a seguinte sintaxe para fazer isso:
df_all = pd. DataFrame ({' idx ':[1,2,3],' dfs ':[df1,df2,df3]})
Podemos então usar a função iloc do pandas para acessar DataFrames aninhados específicos.
Por exemplo, podemos usar a seguinte sintaxe para acessar o primeiro DataFrame aninhado:
#display first nested DataFrame print (df_all[' dfs ']. iloc [0]) item sales 0 to 18 1 B 22 2 C 19 3 D 14 4 E 30
Ou poderíamos usar a seguinte sintaxe para acessar o segundo DataFrame aninhado:
#display second nested DataFrame print (df_all[' dfs ']. iloc [1]) item sales 0 F 10 1 G 12 2:13 a.m. 3 I 13 4 Day 19
E assim por diante.
Recursos adicionais
Os tutoriais a seguir explicam como executar outras funções comuns em pandas:
Como converter índice em coluna no Pandas
Como renomear o índice no Pandas
Como definir coluna como índice no Pandas