Pandas ရှိ အုပ်စုအလိုက် ဆက်စပ်မှုကို တွက်ချက်နည်း
ပန်ဒါရှိ အုပ်စုအလိုက် ကိန်းရှင်နှစ်ခုကြား ဆက်စပ်မှုကို တွက်ချက်ရန် အောက်ပါအခြေခံ syntax ကို သင်အသုံးပြုနိုင်သည်-
df. groupby (' group_var ')[[' values1 ',' values2 ']]. corr (). unstack (). iloc [:, 1 ]
အောက်ဖော်ပြပါ ဥပမာသည် ဤ syntax ကို လက်တွေ့တွင် မည်သို့အသုံးပြုရမည်ကို ပြသထားသည်။
ဥပမာ- Pandas ရှိ အုပ်စုအလိုက် ဆက်စပ်မှုကို တွက်ချက်ပါ။
ကျွန်ုပ်တို့တွင် အောက်ပါ ပန်ဒါ DataFrame ရှိသည် ဆိုပါစို့။
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
' points ': [18, 22, 19, 14, 14, 11, 20, 28],
' assists ': [2, 7, 9, 3, 12, 10, 14, 21]})
#view DataFrame
print (df)
အဖွဲ့ အလိုက် အုပ်စုဖွဲ့ထားသော အမှတ်များ နှင့် ပံ့ပိုးကူညီမှုများ ကြား ဆက်စပ်မှုကို တွက်ချက်ရန် အောက်ပါကုဒ်ကို အသုံးပြုနိုင်သည်။
#calculate correlation between points and assists, grouped by team
df. groupby (' team ')[[' points ',' assists ']]. corr (). unstack (). iloc [:, 1 ]
team
At 0.603053
B 0.981798
Name: (points, assists), dtype: float64
ရလဒ်မှ ကျွန်ုပ်တို့ မြင်နိုင်သည်-
- Team A အတွက် ရမှတ်များနှင့် ပံ့ပိုးကူညီမှုများကြား ဆက်စပ်ကိန်းသည် 0.603053 ဖြစ်သည်။
- Team B အတွက် ရမှတ်များနှင့် ပံ့ပိုးမှုကြား ဆက်စပ်ကိန်းသည် 0.981798 ဖြစ်သည်။
ဆက်စပ်ကိန်းနှစ်ခုစလုံးသည် အပြုသဘောဖြစ်သောကြောင့်၊ ၎င်းသည် နှစ်သင်းစလုံးအတွက် ရမှတ်နှင့် ပံ့ပိုးမှုကြားဆက်ဆံရေးသည် အပြုသဘောဖြစ်ကြောင်း ကျွန်ုပ်တို့ကိုပြောပြသည်။
ဆိုလိုသည်မှာ အမှတ်ပိုရလေ့ရှိသော ကစားသမားများသည်လည်း ပံ့ပိုးမှုပိုမိုမှတ်တမ်းတင်လေ့ရှိသည်။
ဆက်စပ်မှု- အဘယ်အရာကို “ခိုင်မာသော” ဆက်စပ်မှုဟု ယူဆသနည်း။
unstack နှင့် iloc လုပ်ဆောင်ချက်များကို အသုံးမပြုခြင်းဖြင့် syntax ကို အတိုချုံးနိုင်သည်ကို သတိပြုပါ၊ သို့သော် ရလဒ်များမှာ ပိုဆိုးသည်-
df. groupby (' team ')[[' points ',' assists ']]. corr ()
assist points
team
A points 1.000000 0.603053
assists 0.603053 1.000000
B points 1.000000 0.981798
assists 0.981798 1.000000
ဤ syntax သည် အသင်းနှစ်သင်းစလုံးအတွက် ဆက်စပ်မက်ထရစ်ကို ထုတ်လုပ်ပေးသည်၊ ၎င်းသည် ကျွန်ုပ်တို့အား ပိုလျှံသောအချက်အလက်များကိုပေးပါသည်။
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ဖော်ပြပါ သင်ခန်းစာများသည် ပန်ဒါများတွင် အခြားဘုံလုပ်ဆောင်ချက်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-
Pandas တွင် GroupBy ပေါင်းစည်းနည်း
Pandas တွင် Groupby နှင့် Plot ကိုအသုံးပြုနည်း
Pandas ရှိ GroupBy ကို အသုံးပြု၍ ထူးခြားသောတန်ဖိုးများကို ရေတွက်နည်း