Pandas တွင် အမျိုးအစားအလိုက် ဒေတာကို မည်သို့ဆွဲမည်နည်း (ဥပမာများဖြင့်)


categorical data ကို မြင်ယောင်ရန် ဘုံနည်းလမ်းသုံးမျိုးရှိပါသည်။

  • ဘားဇယား
  • အုပ်စုအလိုက် အကွက်များ
  • မှန်စီရွှေချ မြေကွက်များ

အောက်ပါနမူနာများသည် Python ရှိ Python ရှိ ပန်ဒါ DataFrame အတွက် ဤကွက်တစ်ခုစီကို ဖန်တီးနည်းကို ပြသထားသည်။

ဥပမာ 1- ဘားဇယားများ

ပေးထားသော panda DataFrame တွင် အပြောင်းအလဲများ၏ ကြိမ်နှုန်းကို မြင်သာစေရန် ဘားကားချပ်ကို မည်သို့ဖန်တီးရမည်ကို အောက်ပါကုဒ်က ပြသသည်-

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'C', 'C', 'D'],
                   ' points ': [18, 22, 29, 25, 14, 11, 10, 15]})

#create bar plot to visualize frequency of each team
df[' team ']. value_counts (). plot (kind=' bar ', xlabel=' Team ', ylabel=' Count ', rot= 0 )

ပန်ဒါများတွင် အမျိုးအစားအလိုက် အချက်အလက်များကို ပုံဖော်ခြင်း။

X-axis သည် အဖွဲ့တစ်ခုစီ၏အမည်ကိုပြသပြီး Y-axis သည် DataFrame ရှိ အဖွဲ့တစ်ခုစီ၏အကြိမ်ရေကိုပြသသည်။

မှတ်ချက်rot=0 အကြောင်းပြချက်သည် x-axis တံဆိပ်များကို x-axis နှင့် အပြိုင်လှည့်ရန် ပန်ဒါများကို ညွှန်ပြသည်။

ဥပမာ 2- အုပ်စုအလိုက် ကွက်ကွက်များ

Clustered boxplots များသည် categorical variable ဖြင့် အုပ်စုဖွဲ့ထားသော ကိန်းဂဏာန်းပြောင်းလဲမှုကို မြင်သာစေရန် အသုံးဝင်သောနည်းလမ်းတစ်ခုဖြစ်သည်။

ဥပမာအားဖြင့်၊ အဖွဲ့အလိုက် အုပ်စုဖွဲ့ထားသော ရမှတ်များခွဲဝေမှုကိုပြသသည့် အောက်ဖော်ပြပါကုဒ်သည် ရမှတ်များခွဲဝေမှုကိုပြသသည့် ကွက်ကွက်များဖန်တီးနည်းကို ပြသသည်-

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' points ': [18, 22, 29, 25, 14, 11, 10, 15]})

#create boxplot of points, grouped by team
df. boxplot (column=[' points '], by=' team ', grid= False , color=' black ')

x-axis သည် အသင်းများကိုပြသပြီး y-axis သည် အဖွဲ့တစ်ခုစီမှရမှတ်များခွဲဝေမှုကိုပြသသည်။

ဥပမာ 3- mosaic ဇာတ်ကွက်

အကွက်ကွက်တစ်ခုသည် ကွက်ကွက်တစ်ခုတွင် မတူညီသောအမျိုးအစားခွဲကိန်းရှင်နှစ်ခု၏ ကြိမ်နှုန်းများကိုပြသသည့် ကွက်ကွက်အမျိုးအစားတစ်ခုဖြစ်သည်။

ဥပမာအားဖြင့်၊ အောက်ဖော်ပြပါကုဒ်သည် ကွက်ကွက်တစ်ခုတွင် အမျိုးအစားခွဲကွဲပြားသောကိန်းရှင်များ “ ရလဒ်” နှင့် “ အဖွဲ့” ၏အကြိမ်ရေကိုပြသသည့် mosaic ကွက်ကွက်ဖန်တီးနည်းကို ပြသသည်-

 import pandas as pd
from statsmodels. graphics . mosaicplot import mosaic

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'B', 'C', 'C', 'C'],
                   ' result ': ['W', 'L', 'L', 'W', 'W', 'L', 'L', 'W', 'W']})

#create mosaic plot
mosaic(df, [' team ', ' result ']); 

ပန်ဒါရှိ အမျိုးအစားအလိုက် ဒေတာအတွက် mosaic ကွက်ကွက်

x-axis သည် အဖွဲ့များကိုပြသပြီး y-axis သည် အဖွဲ့တစ်ခုစီအတွက် ရလဒ်များ၏ ကြိမ်နှုန်းကိုပြသသည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် ပန်ဒါများတွင် အခြားဘုံအလုပ်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

Pandas တွင် Groupby နှင့် Plot ကိုအသုံးပြုနည်း
Pandas တွင် ကော်လံတန်ဖိုးများ ဖြန့်ချီပုံကို ကြံစည်ပုံ
ပန်ဒါကွက်တစ်ခု၏ ပုံအရွယ်အစားကို ချိန်ညှိနည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်