Cara merencanakan data kategorikal di pandas (dengan contoh)


Ada tiga cara umum untuk memvisualisasikan data kategorikal :

  • Grafik batang
  • Plot kotak berdasarkan kelompok
  • Plot mosaik

Contoh berikut menunjukkan cara membuat masing-masing plot untuk pandas DataFrame dengan Python.

Contoh 1: Diagram Batang

Kode berikut menunjukkan cara membuat diagram batang untuk memvisualisasikan frekuensi pergeseran dalam DataFrame panda tertentu:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'C', 'C', 'D'],
                   ' points ': [18, 22, 29, 25, 14, 11, 10, 15]})

#create bar plot to visualize frequency of each team
df[' team ']. value_counts (). plot (kind=' bar ', xlabel=' Team ', ylabel=' Count ', rot= 0 )

merencanakan data kategorikal di panda

Sumbu X menunjukkan nama masing-masing tim dan sumbu Y menunjukkan frekuensi setiap tim di DataFrame.

Catatan : Argumen rot=0 memberitahu panda untuk memutar label sumbu x agar sejajar dengan sumbu x.

Contoh 2: Plot kotak berdasarkan kelompok

Plot kotak terkluster adalah cara yang berguna untuk memvisualisasikan variabel numerik, yang dikelompokkan berdasarkan variabel kategori.

Misalnya, kode berikut menunjukkan cara membuat plot kotak yang memperlihatkan distribusi poin yang dicetak, dikelompokkan berdasarkan tim:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' points ': [18, 22, 29, 25, 14, 11, 10, 15]})

#create boxplot of points, grouped by team
df. boxplot (column=[' points '], by=' team ', grid= False , color=' black ')

Sumbu x menampilkan tim dan sumbu y menampilkan distribusi poin yang dicetak oleh masing-masing tim.

Contoh 3: plot mosaik

Plot bersusun adalah jenis plot yang menampilkan frekuensi dua variabel kategori berbeda dalam satu plot.

Misalnya, kode berikut menunjukkan cara membuat plot mosaik yang menunjukkan frekuensi variabel kategori “hasil” dan “tim” dalam satu plot:

 import pandas as pd
from statsmodels. graphics . mosaicplot import mosaic

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'B', 'C', 'C', 'C'],
                   ' result ': ['W', 'L', 'L', 'W', 'W', 'L', 'L', 'W', 'W']})

#create mosaic plot
mosaic(df, [' team ', ' result ']); 

plot mosaik untuk data kategorikal di panda

Sumbu x menampilkan tim dan sumbu y menampilkan frekuensi hasil setiap tim.

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di panda:

Cara menggunakan Groupby dan Plot di Pandas
Cara memplot distribusi nilai kolom di Pandas
Cara menyesuaikan ukuran gambar plot panda

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *