Jak wykreślić histogramy według grup w pandach
Do wykreślania histogramów według grup w ramce DataFrame pand można użyć następujących metod:
Metoda 1: Wykreśl histogramy według grup, korzystając z wielu wykresów
df[' values_var ']. hist (by=df[' group_var '])
Metoda 2: Wykreśl histogramy według grup, korzystając z pojedynczego wykresu
plt. hist (group1, alpha= 0.5 , label=' group1 ') plt. hist (group2, alpha= 0.5 , label=' group2 ') plt. hist (group3, alpha= 0.5 , label=' group3 ')
Poniższe przykłady pokazują, jak zastosować każdą metodę w praktyce z następującą ramką DataFrame pand, która pokazuje punkty zdobyte przez koszykarzy z trzech różnych drużyn:
import pandas as pd import numpy as np #make this example reproducible n.p. random . seeds (1) #createDataFrame df = pd. DataFrame ({' team ': np.repeat ([' A ',' B ',' C '], 100 ), ' points ': np. random . normal (loc= 20 , scale= 2 , size= 300 )}) #view head of DataFrame print ( df.head ()) team points 0 A 23.248691 1 A 18.776487 2 A 18.943656 3 A 17.854063 4 A 21.730815
Przykład 1: Wykreśl histogramy według grup, korzystając z wielu wykresów
Poniższy kod pokazuje jak utworzyć trzy histogramy przedstawiające rozkład punktów zdobytych przez zawodników każdej z trzech drużyn:
#create histograms of points by team df[' points ']. hist (by=df[' team '])

Możemy również użyć argumentu kolor krawędzi , aby dodać linie krawędzi do każdego histogramu, oraz argumentu figsize , aby zwiększyć rozmiar każdego histogramu, aby ułatwić jego wizualizację:
#create histograms of points by team df[' points ']. hist (by=df[' team '], edgecolor=' black ', figsize = ( 8 , 6 ))

Przykład 2: Wykreśl histogramy według grup, korzystając z pojedynczego wykresu
Poniższy kod pokazuje, jak utworzyć trzy histogramy i umieścić je wszystkie na tym samym wykresie:
import matplotlib.pyplot as plt
#define points values by group
A = df. loc [df[' team '] == ' A ', ' points ']
B = df. loc [df[' team '] == ' B ', ' points ']
C = df. loc [df[' team '] == ' C ', ' points ']
#add three histograms to one plot
plt. hist (A, alpha= 0.5 , label=' A ')
plt. hist (B, alpha= 0.5 , label=' B ')
plt. hist (C, alpha= 0.5 , label=' C ')
#add plot title and axis labels
plt. title (' Points Distribution by Team ')
plt. xlabel (' Points ')
plt. ylabel (' Frequency ')
#add legend
plt. legend (title=' Team ')
#displayplot
plt. show ()

Efektem końcowym jest wykres przedstawiający trzy histogramy ułożone jeden na drugim.
Uwaga : Argument alfa określa przezroczystość każdego histogramu. Wartość ta może wynosić od 0 do 1. Ustawiając tę wartość na 0,5 możemy lepiej zwizualizować każdy nałożony histogram.
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak tworzyć inne popularne wątki w Pythonie:
Jak wykreślić wiele linii w Matplotlib
Jak utworzyć wykres pudełkowy z Pandas DataFrame
Jak wykreślić wiele kolumn Pand na wykresie słupkowym