Pandy: jak utworzyć wykres słupkowy, aby zwizualizować 10 najważniejszych wartości
Możesz użyć poniższej podstawowej składni, aby utworzyć wykres słupkowy w pandach, który będzie zawierał tylko 10 najczęściej występujących wartości w określonej kolumnie:
import pandas as pd import matplotlib. pyplot as plt #find values with top 10 occurrences in 'my_column' top_10 = (df[' my_column ']. value_counts ()). iloc [:10] #create bar chart to visualize top 10 values top_10. plot (kind='bar')
Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce.
Przykład: utwórz wykres słupkowy w Pandach, aby zwizualizować 10 najważniejszych wartości
Załóżmy, że mamy następującą ramkę danych pand, która zawiera informacje o nazwie drużyny i punktach zdobytych przez 500 różnych koszykarzy:
import pandas as pd import numpy as np from string import ascii_uppercase import random from random import choice #make this example reproducible random. seeds (1) n.p. random . seeds (1) #createDataFrame df = pd. DataFrame ({' team ': [choice(ascii_uppercase) for _ in range(500)], ' points ': np. random . uniform (0, 20, 500)}) #view first five rows of DataFrame print ( df.head ()) team points 0 E 8.340440 1 S 14.406490 2 Z 0.002287 3 Y 6.046651 4 C 2.935118
Możemy zastosować następującą składnię, aby utworzyć wykres słupkowy wyświetlający 10 najczęściej występujących wartości w kolumnie zespół :
import matplotlib. pyplot as plt #find teams with top 10 occurrences top_10_teams = (df[' team ']. value_counts ()).[:10] #create bar chart of top 10 teams top_10_teams. plot (kind=' bar ')
Wykres słupkowy zawiera jedynie nazwy 10 najczęściej występujących drużyn.
Oś x wyświetla nazwę zespołu, a oś y wyświetla częstotliwość.
Pamiętaj, że możemy również dostosować fabułę, aby była bardziej estetyczna:
import matplotlib. pyplot as plt #find teams with top 10 occurrences top_10_teams = (df[' team ']. value_counts ()).[:10] #create bar chart of top 10 teams top_10_teams. plot (kind=' bar ', edgecolor=' black ', rot=0) #add axis labels plt. xlabel (' Team ') plt. ylabel (' Frequency ')
Zauważ, że argument Edgecolor dodał czarną ramkę wokół każdego słupka, a argument rot obrócił etykiety osi X o 90 stopni, aby były łatwiejsze do odczytania.
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w pandach:
Pandy: jak utworzyć skumulowany wykres słupkowy
Pandy: Jak opisywać słupki na wykresie słupkowym
Pandy: Jak wykreślić wiele kolumn na wykresie słupkowym