Panda's: maak een histogram voor elke kolom in dataframe


U kunt de volgende basissyntaxis gebruiken om een histogram te maken voor elke kolom van een Panda DataFrame:

 import pandas as pd
import matplotlib. pyplot as plt

#define number of subplots
fig, axis = plt. subplots (1, 3)

#create histogram for each column in DataFrame
df. hist (ax=axis)

In dit specifieke voorbeeld wordt de functie subplots() gebruikt om op te geven dat er drie kolommen in het DataFrame zijn, en wordt vervolgens voor elke kolom een histogram gemaakt.

Het volgende voorbeeld laat zien hoe u deze syntaxis in de praktijk kunt gebruiken.

Voorbeeld: Maak een histogram voor elke kolom in het Panda-histogram

Stel dat we het volgende panda’s DataFrame hebben dat drie kolommen bevat:

 import pandas as pd
import numpy as np

#make this example reproducible
n.p. random . seeds (1)

#createDataFrame
df = pd. DataFrame ({' points ': np. random . normal (loc=20, scale=2, size=300),
                   ' assists ': np. random . normal (loc=14, scale=3, size=300),
                   ' rebounds ': np. random . normal (loc=12, scale=1, size=300)})

#view head of DataFrame
print ( df.head ())

      points assists rebounds
0 23.248691 20.197350 10.927036
1 18.776487 9.586529 12.495159
2 18.943656 11.509484 11.047938
3 17.854063 11.358267 11.481854
4 21.730815 13.162707 10.538596

We kunnen de volgende syntaxis gebruiken om een histogram te maken voor elk van de drie kolommen van het DataFrame:

 import matplotlib. pyplot as plt

#define format for subplots (1 row and 3 columns)
fig, axis = plt. subplots (1, 3)

#create histogram for each column in DataFrame
df. hist (ax=axis)

Het resultaat is een raster met één rij en drie kolommen, dat voor elke kolom van het DataFrame een histogram weergeeft.

Als u wilt, kunt u het argument figsize gebruiken om de grootte van de histogrammen te wijzigen, evenals de argumenten edgecolor en grid om het uiterlijk van de histogrammen te verbeteren:

 import matplotlib. pyplot as plt 

#define format for subplots
fig, axis = plt. subplots (1, 3, figsize=(8,3))

#create histogram for each column in DataFrame
df. hist (ax=axis, edgecolor=' black ', grid= False ) 

panda's maken een histogram voor elke kolom in DataFrame

Voel je vrij om te spelen met de argumenten van de functie subplots() om het exacte formaat en de grootte van de histogrammen te definiëren.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in panda’s kunt uitvoeren:

Hoe u het aantal gebruikte bakken in het Panda-histogram kunt wijzigen
Hoe het bereik van de X-as in Panda’s histogram te veranderen
Hoe histogrammen per groep in Panda’s te plotten

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert