Cara merencanakan data kategorikal di pandas (dengan contoh)
Ada tiga cara umum untuk memvisualisasikan data kategorikal :
- Grafik batang
- Plot kotak berdasarkan kelompok
- Plot mosaik
Contoh berikut menunjukkan cara membuat masing-masing plot untuk pandas DataFrame dengan Python.
Contoh 1: Diagram Batang
Kode berikut menunjukkan cara membuat diagram batang untuk memvisualisasikan frekuensi pergeseran dalam DataFrame panda tertentu:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'C', 'C', 'D'],
' points ': [18, 22, 29, 25, 14, 11, 10, 15]})
#create bar plot to visualize frequency of each team
df[' team ']. value_counts (). plot (kind=' bar ', xlabel=' Team ', ylabel=' Count ', rot= 0 )
Sumbu X menunjukkan nama masing-masing tim dan sumbu Y menunjukkan frekuensi setiap tim di DataFrame.
Catatan : Argumen rot=0 memberitahu panda untuk memutar label sumbu x agar sejajar dengan sumbu x.
Contoh 2: Plot kotak berdasarkan kelompok
Plot kotak terkluster adalah cara yang berguna untuk memvisualisasikan variabel numerik, yang dikelompokkan berdasarkan variabel kategori.
Misalnya, kode berikut menunjukkan cara membuat plot kotak yang memperlihatkan distribusi poin yang dicetak, dikelompokkan berdasarkan tim:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
' points ': [18, 22, 29, 25, 14, 11, 10, 15]})
#create boxplot of points, grouped by team
df. boxplot (column=[' points '], by=' team ', grid= False , color=' black ')
Sumbu x menampilkan tim dan sumbu y menampilkan distribusi poin yang dicetak oleh masing-masing tim.
Contoh 3: plot mosaik
Plot bersusun adalah jenis plot yang menampilkan frekuensi dua variabel kategori berbeda dalam satu plot.
Misalnya, kode berikut menunjukkan cara membuat plot mosaik yang menunjukkan frekuensi variabel kategori “hasil” dan “tim” dalam satu plot:
import pandas as pd
from statsmodels. graphics . mosaicplot import mosaic
#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'B', 'C', 'C', 'C'],
' result ': ['W', 'L', 'L', 'W', 'W', 'L', 'L', 'W', 'W']})
#create mosaic plot
mosaic(df, [' team ', ' result ']);
Sumbu x menampilkan tim dan sumbu y menampilkan frekuensi hasil setiap tim.
Sumber daya tambahan
Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di panda:
Cara menggunakan Groupby dan Plot di Pandas
Cara memplot distribusi nilai kolom di Pandas
Cara menyesuaikan ukuran gambar plot panda