Pandy: utwórz histogram dla każdej kolumny w dataframe
Możesz użyć następującej podstawowej składni, aby utworzyć histogram dla każdej kolumny ramki DataFrame pandy:
import pandas as pd import matplotlib. pyplot as plt #define number of subplots fig, axis = plt. subplots (1, 3) #create histogram for each column in DataFrame df. hist (ax=axis)
W tym konkretnym przykładzie zastosowano funkcję subplots() , aby określić, że w ramce danych znajdują się 3 kolumny, a następnie utworzono histogram dla każdej kolumny.
Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce.
Przykład: Utwórz histogram dla każdej kolumny w histogramie Pandy
Załóżmy, że mamy następującą ramkę danych pand zawierającą trzy kolumny:
import pandas as pd import numpy as np #make this example reproducible n.p. random . seeds (1) #createDataFrame df = pd. DataFrame ({' points ': np. random . normal (loc=20, scale=2, size=300), ' assists ': np. random . normal (loc=14, scale=3, size=300), ' rebounds ': np. random . normal (loc=12, scale=1, size=300)}) #view head of DataFrame print ( df.head ()) points assists rebounds 0 23.248691 20.197350 10.927036 1 18.776487 9.586529 12.495159 2 18.943656 11.509484 11.047938 3 17.854063 11.358267 11.481854 4 21.730815 13.162707 10.538596
Możemy użyć następującej składni, aby utworzyć histogram dla każdej z trzech kolumn ramki DataFrame:
import matplotlib. pyplot as plt
#define format for subplots (1 row and 3 columns)
fig, axis = plt. subplots (1, 3)
#create histogram for each column in DataFrame
df. hist (ax=axis)
Rezultatem jest siatka z jednym wierszem i trzema kolumnami, która wyświetla histogram dla każdej kolumny ramki DataFrame.
Jeśli chcesz, możesz użyć argumentu figsize , aby zmienić rozmiar histogramów, a także argumentów Edgecolor i Grid , aby poprawić wygląd histogramów:
import matplotlib. pyplot as plt
#define format for subplots
fig, axis = plt. subplots (1, 3, figsize=(8,3))
#create histogram for each column in DataFrame
df. hist (ax=axis, edgecolor=' black ', grid= False )
Możesz pobawić się argumentami funkcji subplots() , aby zdefiniować dokładny format i rozmiar histogramów.
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w pandach:
Jak zmienić liczbę pojemników używanych w histogramie Pandy
Jak zmienić zakres osi X w histogramie Pandy
Jak wykreślić histogramy według grup w Pandach