Hoe u een histogram maakt van pandas dataframe


U kunt de volgende basissyntaxis gebruiken om een histogram te maken op basis van een Panda DataFrame:

 df. hist (column=' col_name ')

De volgende voorbeelden laten zien hoe u deze syntaxis in de praktijk kunt gebruiken.

Voorbeeld 1: Teken één histogram

De volgende code laat zien hoe u één histogram maakt voor een bepaalde kolom in een Panda DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' points ': [25, 12, 15, 14, 19, 23, 25, 29, 29, 31, 31, 33],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4, 7, 7, 8, 9],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12, 10, 7, 7, 9]})

#view first five rows of DataFrame
df. head ()

	points assists rebounds
0 25 5 11
1 12 7 8
2 15 7 10
3 14 9 6
4 19 12 6

#create histogram for 'points' column
df. hist (column=' points ')

We kunnen het histogram ook aanpassen met specifieke kleuren, stijlen, labels en aantal bakken:

 #create custom histogram for 'points' column
df. hist (column=' points ', bins= 5 , grid= False , rwidth= .9 , color=' purple ')

panda-histogram

Op de x-as worden de punten weergegeven die per speler zijn gescoord, en op de y-as ziet u hoe vaak spelers zoveel punten hebben gescoord.

Voorbeeld 2: Meerdere histogrammen plotten

De volgende code laat zien hoe u meerdere histogrammen uit een panda’s DataFrame kunt plotten:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ':['A', 'A', 'A', 'A', 'A', 'A',
                           'B', 'B', 'B', 'B', 'B', 'B'],
                   ' points ': [25, 12, 15, 14, 19, 23, 25, 29, 29, 31, 31, 33]})

#view first five rows
df. head ()

        team points
0 to 25
1 to 12
2 to 15
3 to 14
4 to 19

#create histogram for each team
df. hist (column=' points ', by=' team ', bins= 3 , grid= False , rwidth= .9 ,
        color=' purple ', sharex= True )

verschillende histogrammen in panda's

Merk op dat het sharex- argument specificeert dat de twee histogrammen dezelfde x-as moeten delen.

Dit maakt het gemakkelijker om de verdeling van waarden tussen de twee histogrammen te vergelijken.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende plots in Python kunt maken:

Hoe meerdere lijnen in Matplotlib te plotten
Hoe u een boxplot maakt vanuit Pandas DataFrame
Hoe u meerdere Panda-kolommen in een staafdiagram kunt plotten

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert