Pandy: jak utworzyć wykres słupkowy, aby zwizualizować 10 najważniejszych wartości


Możesz użyć poniższej podstawowej składni, aby utworzyć wykres słupkowy w pandach, który będzie zawierał tylko 10 najczęściej występujących wartości w określonej kolumnie:

 import pandas as pd
import matplotlib. pyplot as plt

#find values with top 10 occurrences in 'my_column'
top_10 = (df[' my_column ']. value_counts ()). iloc [:10]

#create bar chart to visualize top 10 values
top_10. plot (kind='bar')

Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce.

Przykład: utwórz wykres słupkowy w Pandach, aby zwizualizować 10 najważniejszych wartości

Załóżmy, że mamy następującą ramkę danych pand, która zawiera informacje o nazwie drużyny i punktach zdobytych przez 500 różnych koszykarzy:

 import pandas as pd
import numpy as np
from string import ascii_uppercase
import random
from random import choice

#make this example reproducible
random. seeds (1)
n.p. random . seeds (1)

#createDataFrame
df = pd. DataFrame ({' team ': [choice(ascii_uppercase) for _ in range(500)],
                   ' points ': np. random . uniform (0, 20, 500)})

#view first five rows of DataFrame
print ( df.head ())

  team points
0 E 8.340440
1 S 14.406490
2 Z 0.002287
3 Y 6.046651
4 C 2.935118

Możemy zastosować następującą składnię, aby utworzyć wykres słupkowy wyświetlający 10 najczęściej występujących wartości w kolumnie zespół :

 import matplotlib. pyplot as plt

#find teams with top 10 occurrences
top_10_teams = (df[' team ']. value_counts ()).[:10]

#create bar chart of top 10 teams
top_10_teams. plot (kind=' bar ') 

Wykres słupkowy zawiera jedynie nazwy 10 najczęściej występujących drużyn.

Oś x wyświetla nazwę zespołu, a oś y wyświetla częstotliwość.

Pamiętaj, że możemy również dostosować fabułę, aby była bardziej estetyczna:

 import matplotlib. pyplot as plt

#find teams with top 10 occurrences
top_10_teams = (df[' team ']. value_counts ()).[:10]

#create bar chart of top 10 teams
top_10_teams. plot (kind=' bar ', edgecolor=' black ', rot=0)

#add axis labels
plt. xlabel (' Team ')
plt. ylabel (' Frequency ')

Zauważ, że argument Edgecolor dodał czarną ramkę wokół każdego słupka, a argument rot obrócił etykiety osi X o 90 stopni, aby były łatwiejsze do odczytania.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w pandach:

Pandy: jak utworzyć skumulowany wykres słupkowy
Pandy: Jak opisywać słupki na wykresie słupkowym
Pandy: Jak wykreślić wiele kolumn na wykresie słupkowym

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *