Python တွင် contingency table ကိုဖန်တီးနည်း
contingency table သည် categorical variable နှစ်ခုကြားရှိ ဆက်စပ်မှုကို အကျဉ်းချုပ်ဖော်ပြသော ဇယားအမျိုးအစားတစ်ခုဖြစ်သည်။
Python တွင် အရေးပေါ်ဇယားတစ်ခုဖန်တီးရန်၊ အောက်ပါ syntax ကိုအသုံးပြုသည့် pandas.crosstab() လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်ပါသည်။
pandas.crosstab(အညွှန်း၊ ကော်လံ)
ရွှေ-
- အညွှန်း- အရေးပေါ်ဇယား၏အတန်းများတွင် ပြသရန် ကိန်းရှင်၏အမည်
- ကော်လံများ- အရေးပေါ်ဇယား၏ ကော်လံများတွင် ပြသရန် ကိန်းရှင်၏အမည်
အောက်ဖော်ပြပါ အဆင့်ဆင့် ဥပမာသည် Python တွင် အရေးပေါ်အခြေအနေဇယားတစ်ခုဖန်တီးရန် ဤလုပ်ဆောင်ချက်ကို အသုံးပြုနည်းကို ပြသထားသည်။
အဆင့် 1: ဒေတာကိုဖန်တီးပါ။
ပထမဦးစွာ၊ ဝယ်ယူထားသော ထုတ်ကုန်အမျိုးအစား (တီဗီ၊ ကွန်ပျူတာ သို့မဟုတ် ရေဒီယို) အပြင် ကုန်ပစ္စည်းဝယ်ယူခဲ့သည့် နိုင်ငံ (A၊ B၊ သို့မဟုတ် C) အပါအဝင် မတူညီသော ကုန်ပစ္စည်းအမှာစာ 20 ၏ အချက်အလက်များကို ပြသသည့်ဒေတာအတွဲတစ်ခုကို ဖန်တီးကြပါစို့-
import pandas as pd #create data df = pd. DataFrame ({'Order': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20], 'Product': ['TV', 'TV', 'Comp', 'TV', 'TV', 'Comp', 'Comp', 'Comp', 'TV', 'Radio', 'TV', 'Radio', 'Radio', 'Radio', 'Comp', 'Comp', 'TV', 'TV', 'Radio', 'TV'], 'Country': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'C', 'C', 'C', 'C', 'C', 'C', 'C', 'C']}) #view data df Order Product Country 0 1 TV A 1 2 TV A 2 3 Comp A 3 4 TV A 4 5 TV B 5 6 Comp B 6 7 Comp B 7 8 Comp B 8 9 TV B 9 10 Radio B 10 11 TV B 11 12 Radio B 12 13 Radio C 13 14 Radio C 14 15 Comp C 15 16 Comp C 16 17 TV C 17 18 TV C 18 19 Radio C 19 20 TV C
အဆင့် 2: အရေးပေါ်အခြေအနေဇယားကိုဖန်တီးပါ။
အောက်ပါကုဒ်သည် နိုင်ငံတစ်ခုစီမှ မှာယူထားသော ထုတ်ကုန်တစ်ခုစီ၏ အရေအတွက်ကို ရေတွက်ရန် အရေးပေါ်ဇယားကို ဖန်တီးနည်းကို ပြသသည်-
#create contingency table p.d. crosstab (index=df[' Country '], columns=df[' Product ']) Product Comp Radio TV Country A 1 0 3 B 3 2 3 C 2 3 3
ဤတွင် ဇယားကို အဓိပ္ပာယ်ဖွင့်ဆိုပုံမှာ-
- နိုင်ငံ A တွင် စုစုပေါင်း ကွန်ပျူတာ ၁ လုံး ဝယ်ယူခဲ့သည်။
- နိုင်ငံ B တွင် စုစုပေါင်း ကွန်ပျူတာ ၃ လုံး ဝယ်ယူခဲ့သည်။
- နိုင်ငံ C တွင် စုစုပေါင်း ကွန်ပျူတာ ၂ လုံး ဝယ်ယူခဲ့သည်။
- နိုင်ငံ A တွင် ရေဒီယို စုစုပေါင်း ၀ ယ်ယူခဲ့သည်။
- နိုင်ငံ B တွင် စုစုပေါင်း ရေဒီယို ၂ လုံး ဝယ်ယူခဲ့သည်။
- နိုင်ငံ C တွင် စုစုပေါင်း ရေဒီယို ၃ လုံး ဝယ်ယူခဲ့သည်။
- နိုင်ငံ A တွင် စုစုပေါင်း ရုပ်မြင်သံကြား ၃ လုံး ဝယ်ယူခဲ့သည်။
- နိုင်ငံ B တွင် စုစုပေါင်း ရုပ်မြင်သံကြား ၃ လုံး ဝယ်ယူခဲ့သည်။
- နိုင်ငံ C တွင် စုစုပေါင်း ရုပ်မြင်သံကြား ၃ လုံး ဝယ်ယူခဲ့သည်။
အဆင့် 3- အနားသတ်စုစုပေါင်းများကို အရေးပေါ်ဇယားသို့ ထည့်ပါ။
margins=True argument ကို အသုံးပြု၍ margin စုစုပေါင်းများကို contingency table သို့ ထည့်ရန်-
#add margins to contingency table p.d. crosstab (index=df[' Country '], columns=df[' Product '], margins= True ) Product Comp Radio TV All Country A 1 0 3 4 B 3 2 3 8 C 2 3 3 8 All 6 5 9 20
ဇယားတန်ဖိုးများကို အဓိပ္ပာယ်ဖွင့်ဆိုရန် နည်းလမ်းမှာ အောက်ပါအတိုင်းဖြစ်သည်။
လိုင်းစုစုပေါင်း-
- နိုင်ငံ A မှ မှာယူမှု စုစုပေါင်း (၄) ခု ရှိသည်။
- နိုင်ငံ B မှ မှာယူမှု 8 ကြိမ်
- နိုင်ငံ C မှ အမှာစာ ၈ စောင်
ကော်လံ စုစုပေါင်း-
- စုစုပေါင်း ကွန်ပြူတာ ၆ လုံး ဝယ်ယူခဲ့သည်။
- စုစုပေါင်း ရေဒီယို ၅ လုံး ဝယ်ယူခဲ့သည်။
- စုစုပေါင်း ရုပ်မြင်သံကြား ၉ လုံး ဝယ်ယူခဲ့သည်။
ဇယား၏ ညာဘက်အောက်ထောင့်ရှိ တန်ဖိုးသည် နိုင်ငံတိုင်းမှ ကုန်ပစ္စည်း စုစုပေါင်း 20 ကို မှာယူထားကြောင်း ပြသထားသည်။
ထပ်လောင်းအရင်းအမြစ်များ
R တွင် အရေးပေါ်ဇယားတစ်ခုဖန်တီးနည်း
Excel တွင် Contingency Table ဖန်တီးနည်း