Pandalarda kategorik veriler nasıl çizilir (örneklerle)
Kategorik verileri görselleştirmenin üç yaygın yolu vardır:
- Grafik çubuğu
- Gruba göre kutu grafikleri
- Mozaik araziler
Aşağıdaki örnekler Python’da bir panda DataFrame için bu grafiklerin her birinin nasıl oluşturulacağını gösterir.
Örnek 1: Çubuk Grafikler
Aşağıdaki kod, belirli bir panda DataFrame’deki vardiyaların sıklığını görselleştirmek için bir çubuk grafiğin nasıl oluşturulacağını gösterir:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'C', 'C', 'D'],
' points ': [18, 22, 29, 25, 14, 11, 10, 15]})
#create bar plot to visualize frequency of each team
df[' team ']. value_counts (). plot (kind=' bar ', xlabel=' Team ', ylabel=' Count ', rot= 0 )
X ekseni her takımın adını gösterir ve Y ekseni DataFrame’deki her takımın sıklığını gösterir.
Not : rot=0 argümanı pandalara x ekseni etiketlerini x eksenine paralel olacak şekilde döndürmelerini söyler.
Örnek 2: Gruba göre kutu grafikleri
Kümelenmiş kutu grafikleri, kategorik bir değişkene göre gruplandırılmış sayısal bir değişkeni görselleştirmenin yararlı bir yoludur.
Örneğin, aşağıdaki kod, takıma göre gruplandırılmış olarak atılan puanların dağılımını gösteren kutu grafiklerinin nasıl oluşturulacağını gösterir:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
' points ': [18, 22, 29, 25, 14, 11, 10, 15]})
#create boxplot of points, grouped by team
df. boxplot (column=[' points '], by=' team ', grid= False , color=' black ')
X ekseni takımları, y ekseni ise her takımın kazandığı puanların dağılımını gösterir.
Örnek 3: mozaik çizimi
Döşenmiş grafik, iki farklı kategorik değişkenin frekanslarını tek bir grafikte görüntüleyen bir grafik türüdür.
Örneğin, aşağıdaki kod, tek bir grafikte “sonuç” ve “ekip” kategorik değişkenlerinin sıklığını gösteren bir mozaik grafiğin nasıl oluşturulacağını gösterir:
import pandas as pd
from statsmodels. graphics . mosaicplot import mosaic
#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'B', 'C', 'C', 'C'],
' result ': ['W', 'L', 'L', 'W', 'W', 'L', 'L', 'W', 'W']})
#create mosaic plot
mosaic(df, [' team ', ' result ']);
X ekseni takımları, y ekseni ise her takım için sonuçların sıklığını gösterir.
Ek kaynaklar
Aşağıdaki eğitimlerde pandalarda diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:
Pandalarda Groupby ve Plot nasıl kullanılır?
Pandalarda sütun değerlerinin dağılımı nasıl çizilir
Bir panda grafiğinin şekil boyutu nasıl ayarlanır?