Como criar um histograma a partir do pandas dataframe
Você pode usar a seguinte sintaxe básica para criar um histograma a partir de um DataFrame do pandas:
df. hist (column=' col_name ')
Os exemplos a seguir mostram como usar essa sintaxe na prática.
Exemplo 1: traçar um único histograma
O código a seguir mostra como criar um único histograma para uma coluna específica em um DataFrame do pandas:
import pandas as pd #createDataFrame df = pd. DataFrame ({' points ': [25, 12, 15, 14, 19, 23, 25, 29, 29, 31, 31, 33], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4, 7, 7, 8, 9], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12, 10, 7, 7, 9]}) #view first five rows of DataFrame df. head () points assists rebounds 0 25 5 11 1 12 7 8 2 15 7 10 3 14 9 6 4 19 12 6 #create histogram for 'points' column df. hist (column=' points ')
Também podemos personalizar o histograma com cores, estilos, rótulos e número de caixas específicos:
#create custom histogram for 'points' column df. hist (column=' points ', bins= 5 , grid= False , rwidth= .9 , color=' purple ')
O eixo x mostra os pontos marcados por jogador e o eixo y mostra a frequência de quantos jogadores marcaram tantos pontos.
Exemplo 2: plotando vários histogramas
O código a seguir mostra como plotar vários histogramas de um DataFrame do pandas:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ':['A', 'A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B', 'B'], ' points ': [25, 12, 15, 14, 19, 23, 25, 29, 29, 31, 31, 33]}) #view first five rows df. head () team points 0 to 25 1 to 12 2 to 15 3 to 14 4 to 19 #create histogram for each team df. hist (column=' points ', by=' team ', bins= 3 , grid= False , rwidth= .9 , color=' purple ', sharex= True )
Observe que o argumento sharex especifica que os dois histogramas devem compartilhar o mesmo eixo x.
Isso facilita a comparação da distribuição dos valores entre os dois histogramas.
Recursos adicionais
Os tutoriais a seguir explicam como criar outros gráficos comuns em Python:
Como plotar múltiplas linhas no Matplotlib
Como criar um boxplot a partir do Pandas DataFrame
Como plotar múltiplas colunas Pandas em um gráfico de barras