Jak utworzyć histogram z pandas dataframe
Aby utworzyć histogram z ramki DataFrame pandy, możesz użyć następującej podstawowej składni:
df. hist (column=' col_name ')
Poniższe przykłady pokazują, jak używać tej składni w praktyce.
Przykład 1: Wykreśl pojedynczy histogram
Poniższy kod pokazuje, jak utworzyć pojedynczy histogram dla określonej kolumny w ramce DataFrame pandy:
import pandas as pd #createDataFrame df = pd. DataFrame ({' points ': [25, 12, 15, 14, 19, 23, 25, 29, 29, 31, 31, 33], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4, 7, 7, 8, 9], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12, 10, 7, 7, 9]}) #view first five rows of DataFrame df. head () points assists rebounds 0 25 5 11 1 12 7 8 2 15 7 10 3 14 9 6 4 19 12 6 #create histogram for 'points' column df. hist (column=' points ')
Możemy również dostosować histogram za pomocą określonych kolorów, stylów, etykiet i liczby pojemników:
#create custom histogram for 'points' column df. hist (column=' points ', bins= 5 , grid= False , rwidth= .9 , color=' purple ')
Oś x pokazuje punkty zdobyte na gracza, a oś y pokazuje częstotliwość, ilu graczy zdobyło daną liczbę punktów.
Przykład 2: Wykreślanie wielu histogramów
Poniższy kod pokazuje, jak wykreślić wiele histogramów z ramki DataFrame pandy:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ':['A', 'A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B', 'B'], ' points ': [25, 12, 15, 14, 19, 23, 25, 29, 29, 31, 31, 33]}) #view first five rows df. head () team points 0 to 25 1 to 12 2 to 15 3 to 14 4 to 19 #create histogram for each team df. hist (column=' points ', by=' team ', bins= 3 , grid= False , rwidth= .9 , color=' purple ', sharex= True )
Należy zauważyć, że argument sharex określa, że oba histogramy muszą mieć tę samą oś x.
Ułatwia to porównanie rozkładu wartości pomiędzy dwoma histogramami.
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak tworzyć inne popularne wątki w Pythonie:
Jak wykreślić wiele linii w Matplotlib
Jak utworzyć wykres pudełkowy z Pandas DataFrame
Jak wykreślić wiele kolumn Pand na wykresie słupkowym