Como converter um dataframe do pandas para json


Freqüentemente, você pode estar interessado em converter um DataFrame do pandas para o formato JSON.

Felizmente, isso é fácil de fazer usando a função to_json() , que permite converter um DataFrame em uma string JSON com um dos seguintes formatos:

  • ‘dividir’: dict como {‘índice’ -> [índice], ‘colunas’ -> [colunas], ‘dados’ -> [valores]}
  • ‘registros’: lista como [{coluna -> valor}, …, {coluna -> valor}]
  • ‘índice’: dite como {índice -> {coluna -> valor}}
  • ‘colunas’: dita como {coluna -> {índice -> valor}}
  • ‘valores’: apenas a matriz de valores
  • ‘tabela’: ditar como {‘schema’: {schema}, ‘data’: {data}}

Este tutorial mostra como converter um DataFrame para cada um dos seis formatos usando o seguinte DataFrame do pandas:

 import pandas as pd

#createDataFrame
df = pd.DataFrame({'points': [25, 12, 15, 19],
                   'assists': [5, 7, 7, 12]})  

#view DataFrame
df

        assist points
0 25 5
1 12 7
2 15 7
3 19 12

Método 1: “Dividir”

 df. to_json (orient=' split ')

{
   "columns": [
      "points",
      "assists"
   ],
   "index": [
      0,
      1,
      2,
      3
   ],
   "data": [
      [
         25,
         5
      ],
      [
         12,
         7
      ],
      [
         15,
         7
      ],
      [
         19,
         12
      ]
   ]
}

Método 2: “Gravações”

 df. to_json (orient=' records ')

[
   {
      "points": 25,
      “assists”: 5
   },
   {
      "points": 12,
      “assists”: 7
   },
   {
      "points": 15,
      “assists”: 7
   },
   {
      "points": 19,
      “assists”: 12
   }
]

Método 3: “Índice”

 df. to_json (orient=' index ') 

{
   "0": {
      "points": 25,
      “assists”: 5
   },
   "1": {
      "points": 12,
      “assists”: 7
   },
   "2": {
      "points": 15,
      “assists”: 7
   },
   "3": {
      "points": 19,
      “assists”: 12
   }
}

Método 4: “Colunas”

 df. to_json (orient=' columns ') 

{
   "dots": {
      "0": 25,
      "1": 12,
      "2": 15,
      "3": 19
   },
   "assists": {
      "0": 5,
      "1": 7,
      "2": 7,
      "3": 12
   }
}

Método 5: “Valores”

 df. to_json (orient=' values ') 

[
   [
      25,
      5
   ],
   [
      12,
      7
   ],
   [
      15,
      7
   ],
   [
      19,
      12
   ]
]

Método 6: “Tabela”

 df. to_json (orient=' table ') 

{
   "plan": {
      "fields": [
         {
            "name": "index",
            "type": "integer"
         },
         {
            "name": "points",
            "type": "integer"
         },
         {
            "name": "assists",
            "type": "integer"
         }
      ],
      "primaryKey": [
         "index"
      ],
      "pandas_version": "0.20.0"
   },
   "data": [
      {
         "index": 0,
         "points": 25,
         “assists”: 5
      },
      {
         "index": 1,
         "points": 12,
         “assists”: 7
      },
      {
         "index": 2,
         "points": 15,
         “assists”: 7
      },
      {
         "index": 3,
         "points": 19,
         “assists”: 12
      }
   ]
}

Como exportar um arquivo JSON

Você pode usar a seguinte sintaxe para exportar um arquivo JSON para um caminho de arquivo específico em seu computador:

 #create JSON file 
json_file = df. to_json (orient=' records ') 

#export JSON file
with open('my_data.json', 'w') as f:
    f.write(json_file)

Você pode encontrar a documentação completa da função pandas to_json() aqui .

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *