Python တွင် correlation matrix ကိုဖန်တီးနည်း
variable နှစ်ခုကြားရှိ ဆက်နွယ်မှုကို တိုင်းတာရန် နည်းလမ်းတစ်ခုမှာ Pearson correlation coefficient ကို အသုံးပြုခြင်းဖြစ်ပြီး ကိန်းရှင်နှစ်ခုကြားရှိ မျဉ်းကြောင်းဆက်စပ်မှုကို တိုင်းတာခြင်းဖြစ်ပါသည် ။
၎င်းသည် -1 နှင့် 1 ကြားရှိတန်ဖိုးကို ယူသည်-
- -1 သည် လုံးဝအနုတ်လက္ခဏာ မျဉ်းကြောင်းဆက်စပ်မှုကို ညွှန်ပြသည်။
- 0 သည် linear ဆက်စပ်မှုမရှိသည်ကို ညွှန်ပြသည်။
- 1 သည် လုံးဝအပြုသဘောဆောင်သော linear ဆက်စပ်မှုကို ညွှန်ပြသည်။
ဆက်စပ်ဆက်နွယ်မှုကိန်းဂဏန်းသည် သုညမှဖြစ်ပြီး၊ ကိန်းရှင်နှစ်ခုကြားရှိ ဆက်နွယ်မှုအားကောင်းလေဖြစ်သည်။
သို့သော် အချို့ကိစ္စများတွင်၊ ကိန်းရှင်အတွဲများစွာကြားရှိ ဆက်စပ်မှုကို ကျွန်ုပ်တို့နားလည်လိုပါသည်။ ဤကိစ္စများတွင်၊ ကိန်းရှင်များစွာ၏ pairwise ပေါင်းစပ်မှုများကြားရှိ ဆက်စပ်ကိန်းများကိုပြသသည့် စတုရန်းဇယားဖြစ်သည့် ဆက်စပ်မက်ထရစ်ကို ကျွန်ုပ်တို့ဖန်တီးနိုင်သည်။
ဤသင်ခန်းစာတွင် Python ရှိ ဆက်စပ်မက်ထရစ်ကို ဖန်တီးပြီး အဓိပ္ပာယ်ပြန်ဆိုနည်းကို ရှင်းပြထားသည်။
Python တွင် Correlation Matrix ကိုဖန်တီးနည်း
Python တွင် ဆက်စပ်မက်ထရစ်တစ်ခုကို ဖန်တီးရန် အောက်ပါအဆင့်များကို အသုံးပြုပါ။
အဆင့် 1: ဒေတာအတွဲကို ဖန်တီးပါ။
import pandas as pd data = {'assists': [4, 5, 5, 6, 7, 8, 8, 10], 'rebounds': [12, 14, 13, 7, 8, 8, 9, 13], 'points': [22, 24, 26, 26, 29, 32, 20, 14] } df = pd. DataFrame (data, columns=['assists','rebounds','points']) df assist rebound points 0 4 12 22 1 5 14 24 2 5 13 26 3 6 7 26 4 7 8 29 5 8 8 32 6 8 9 20 7 10 13 14
အဆင့် 2- ဆက်စပ်မက်ထရစ်ကို ဖန်တီးပါ။
#create correlation matrix df. corr () assists rebound points assists 1.000000 -0.244861 -0.329573 rebounds -0.244861 1.000000 -0.522092 points -0.329573 -0.522092 1.000000 #create same correlation matrix with coefficients rounded to 3 decimals df. corr (). round (3) assists rebound points assists 1.000 -0.245 -0.330 rebounds -0.245 1.000 -0.522 points -0.330 -0.522 1.000
အဆင့် 3- ဆက်စပ်မက်ထရစ်ကို အဓိပါယ်ဖွင့်ပါ။
ကိန်းရှင်တစ်ခုစီသည် သူ့ဘာသာသူနှင့် လုံးဝဆက်စပ်နေသောကြောင့် ဇယား၏ထောင့်ဖြတ်တစ်လျှောက်ရှိ ဆက်စပ်ကိန်းများကို 1 နှင့် ညီမျှသည်။
အခြားဆက်စပ်ဆက်စပ်ကိန်းများ အားလုံးသည် မတူညီသော အတွဲအစပ် ပေါင်းစပ်ကိန်းရှင်များကြား ဆက်စပ်မှုကို ညွှန်ပြသည်။ ဥပမာအားဖြင့်:
- ကူညီပေးခြင်းနှင့် ပြန်ခုန်ခြင်းကြား ဆက်စပ်ကိန်းသည် -0.245 ဖြစ်သည်။
- အကူအညီနှင့် ရမှတ်များကြား ဆက်စပ်ကိန်းသည် -0.330 ဖြစ်သည်။
- ပြန်လှန်ခြင်းနှင့် အမှတ်များကြား ဆက်စပ်ကိန်းသည် -0.522 ဖြစ်သည်။
အဆင့် 4- ဆက်စပ်မက်ထရစ်ကို မြင်ယောင်ကြည့်ပါ (ချန်လှပ်ထားနိုင်သည်)။
ပန်ဒါများတွင် ရရှိနိုင်သော စတိုင်လ်ရွေးချယ်စရာများကို အသုံးပြု၍ ဆက်စပ်မက်ထရစ်ကို သင်မြင်ယောင်နိုင်သည်-
corr = df. corr () corr. style . background_gradient (cmap='coolwarm')
မတူညီသောအရောင်များဖြင့် ဆက်စပ်မက်ထရစ်ကိုထုတ်လုပ်ရန် cmap အကြောင်းပြချက်ကိုလည်း သင်မွမ်းမံနိုင်သည်။
corr = df. corr () corr. style . background_gradient (cmap=' RdYlGn ')
corr = df. corr () corr. style . background_gradient (cmap=' bwr ')
corr = df. corr () corr. style . background_gradient (cmap=' PuOr ')
မှတ်ချက် – cmap အငြင်းအခုံများစာရင်း အပြည့်အစုံအတွက် matplotlib စာရွက်စာတမ်းကို ကြည့်ပါ။