Python တွင် contingency table ကိုဖန်တီးနည်း


contingency table သည် categorical variable နှစ်ခုကြားရှိ ဆက်စပ်မှုကို အကျဉ်းချုပ်ဖော်ပြသော ဇယားအမျိုးအစားတစ်ခုဖြစ်သည်။

Python တွင် အရေးပေါ်ဇယားတစ်ခုဖန်တီးရန်၊ အောက်ပါ syntax ကိုအသုံးပြုသည့် pandas.crosstab() လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်ပါသည်။

pandas.crosstab(အညွှန်း၊ ကော်လံ)

ရွှေ-

  • အညွှန်း- အရေးပေါ်ဇယား၏အတန်းများတွင် ပြသရန် ကိန်းရှင်၏အမည်
  • ကော်လံများ- အရေးပေါ်ဇယား၏ ကော်လံများတွင် ပြသရန် ကိန်းရှင်၏အမည်

အောက်ဖော်ပြပါ အဆင့်ဆင့် ဥပမာသည် Python တွင် အရေးပေါ်အခြေအနေဇယားတစ်ခုဖန်တီးရန် ဤလုပ်ဆောင်ချက်ကို အသုံးပြုနည်းကို ပြသထားသည်။

အဆင့် 1: ဒေတာကိုဖန်တီးပါ။

ပထမဦးစွာ၊ ဝယ်ယူထားသော ထုတ်ကုန်အမျိုးအစား (တီဗီ၊ ကွန်ပျူတာ သို့မဟုတ် ရေဒီယို) အပြင် ကုန်ပစ္စည်းဝယ်ယူခဲ့သည့် နိုင်ငံ (A၊ B၊ သို့မဟုတ် C) အပါအဝင် မတူညီသော ကုန်ပစ္စည်းအမှာစာ 20 ၏ အချက်အလက်များကို ပြသသည့်ဒေတာအတွဲတစ်ခုကို ဖန်တီးကြပါစို့-

 import pandas as pd

#create data
df = pd. DataFrame ({'Order': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10,
                            11, 12, 13, 14, 15, 16, 17, 18, 19, 20],
                   'Product': ['TV', 'TV', 'Comp', 'TV', 'TV', 'Comp',
                               'Comp', 'Comp', 'TV', 'Radio', 'TV', 'Radio', 'Radio',
                               'Radio', 'Comp', 'Comp', 'TV', 'TV', 'Radio', 'TV'],
                   'Country': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B', 'B', 'B',
                               'B', 'C', 'C', 'C', 'C', 'C', 'C', 'C', 'C']})

#view data
df

        Order Product Country
0 1 TV A
1 2 TV A
2 3 Comp A
3 4 TV A
4 5 TV B
5 6 Comp B
6 7 Comp B
7 8 Comp B
8 9 TV B
9 10 Radio B
10 11 TV B
11 12 Radio B
12 13 Radio C
13 14 Radio C
14 15 Comp C
15 16 Comp C
16 17 TV C
17 18 TV C
18 19 Radio C
19 20 TV C

အဆင့် 2: အရေးပေါ်အခြေအနေဇယားကိုဖန်တီးပါ။

အောက်ပါကုဒ်သည် နိုင်ငံတစ်ခုစီမှ မှာယူထားသော ထုတ်ကုန်တစ်ခုစီ၏ အရေအတွက်ကို ရေတွက်ရန် အရေးပေါ်ဇယားကို ဖန်တီးနည်းကို ပြသသည်-

 #create contingency table
p.d. crosstab (index=df[' Country '], columns=df[' Product '])

Product Comp Radio TV
Country			
A 1 0 3
B 3 2 3
C 2 3 3

ဤတွင် ဇယားကို အဓိပ္ပာယ်ဖွင့်ဆိုပုံမှာ-

  • နိုင်ငံ A တွင် စုစုပေါင်း ကွန်ပျူတာ ၁ လုံး ဝယ်ယူခဲ့သည်။
  • နိုင်ငံ B တွင် စုစုပေါင်း ကွန်ပျူတာ လုံး ဝယ်ယူခဲ့သည်။
  • နိုင်ငံ C တွင် စုစုပေါင်း ကွန်ပျူတာ ၂ လုံး ဝယ်ယူခဲ့သည်။
  • နိုင်ငံ A တွင် ရေဒီယို စုစုပေါင်း ယ်ယူခဲ့သည်။
  • နိုင်ငံ B တွင် စုစုပေါင်း ရေဒီယို ၂ လုံး ဝယ်ယူခဲ့သည်။
  • နိုင်ငံ C တွင် စုစုပေါင်း ရေဒီယို ၃ လုံး ဝယ်ယူခဲ့သည်။
  • နိုင်ငံ A တွင် စုစုပေါင်း ရုပ်မြင်သံကြား ၃ လုံး ဝယ်ယူခဲ့သည်။
  • နိုင်ငံ B တွင် စုစုပေါင်း ရုပ်မြင်သံကြား ၃ လုံး ဝယ်ယူခဲ့သည်။
  • နိုင်ငံ C တွင် စုစုပေါင်း ရုပ်မြင်သံကြား ၃ လုံး ဝယ်ယူခဲ့သည်။

အဆင့် 3- အနားသတ်စုစုပေါင်းများကို အရေးပေါ်ဇယားသို့ ထည့်ပါ။

margins=True argument ကို အသုံးပြု၍ margin စုစုပေါင်းများကို contingency table သို့ ထည့်ရန်-

 #add margins to contingency table
p.d. crosstab (index=df[' Country '], columns=df[' Product '], margins= True )

Product Comp Radio TV All
Country				
A 1 0 3 4
B 3 2 3 8
C 2 3 3 8
All 6 5 9 20

ဇယားတန်ဖိုးများကို အဓိပ္ပာယ်ဖွင့်ဆိုရန် နည်းလမ်းမှာ အောက်ပါအတိုင်းဖြစ်သည်။

လိုင်းစုစုပေါင်း-

  • နိုင်ငံ A မှ မှာယူမှု စုစုပေါင်း (၄) ခု ရှိသည်။
  • နိုင်​ငံ B မှ မှာယူမှု 8 ကြိမ်
  • နိုင်​ငံ C မှ အမှာစာ ​စောင်

ကော်လံ စုစုပေါင်း-

  • စုစုပေါင်း ကွန်ပြူတာ လုံး ဝယ်ယူခဲ့သည်။
  • စုစုပေါင်း ရေဒီယို လုံး ဝယ်ယူခဲ့သည်။
  • စုစုပေါင်း ရုပ်မြင်သံကြား ၉ လုံး ဝယ်ယူခဲ့သည်။

ဇယား၏ ညာဘက်အောက်ထောင့်ရှိ တန်ဖိုးသည် နိုင်ငံတိုင်းမှ ကုန်ပစ္စည်း စုစုပေါင်း 20 ကို မှာယူထားကြောင်း ပြသထားသည်။

ထပ်လောင်းအရင်းအမြစ်များ

R တွင် အရေးပေါ်ဇယားတစ်ခုဖန်တီးနည်း
Excel တွင် Contingency Table ဖန်တီးနည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်