Python တွင် correlation matrix ကိုဖန်တီးနည်း


variable နှစ်ခုကြားရှိ ဆက်နွယ်မှုကို တိုင်းတာရန် နည်းလမ်းတစ်ခုမှာ Pearson correlation coefficient ကို အသုံးပြုခြင်းဖြစ်ပြီး ကိန်းရှင်နှစ်ခုကြားရှိ မျဉ်းကြောင်းဆက်စပ်မှုကို တိုင်းတာခြင်းဖြစ်ပါသည်

၎င်းသည် -1 နှင့် 1 ကြားရှိတန်ဖိုးကို ယူသည်-

  • -1 သည် လုံးဝအနုတ်လက္ခဏာ မျဉ်းကြောင်းဆက်စပ်မှုကို ညွှန်ပြသည်။
  • 0 သည် linear ဆက်စပ်မှုမရှိသည်ကို ညွှန်ပြသည်။
  • 1 သည် လုံးဝအပြုသဘောဆောင်သော linear ဆက်စပ်မှုကို ညွှန်ပြသည်။

ဆက်စပ်ဆက်နွယ်မှုကိန်းဂဏန်းသည် သုညမှဖြစ်ပြီး၊ ကိန်းရှင်နှစ်ခုကြားရှိ ဆက်နွယ်မှုအားကောင်းလေဖြစ်သည်။

သို့သော် အချို့ကိစ္စများတွင်၊ ကိန်းရှင်အတွဲများစွာကြားရှိ ဆက်စပ်မှုကို ကျွန်ုပ်တို့နားလည်လိုပါသည်။ ဤကိစ္စများတွင်၊ ကိန်းရှင်များစွာ၏ pairwise ပေါင်းစပ်မှုများကြားရှိ ဆက်စပ်ကိန်းများကိုပြသသည့် စတုရန်းဇယားဖြစ်သည့် ဆက်စပ်မက်ထရစ်ကို ကျွန်ုပ်တို့ဖန်တီးနိုင်သည်။

ဤသင်ခန်းစာတွင် Python ရှိ ဆက်စပ်မက်ထရစ်ကို ဖန်တီးပြီး အဓိပ္ပာယ်ပြန်ဆိုနည်းကို ရှင်းပြထားသည်။

Python တွင် Correlation Matrix ကိုဖန်တီးနည်း

Python တွင် ဆက်စပ်မက်ထရစ်တစ်ခုကို ဖန်တီးရန် အောက်ပါအဆင့်များကို အသုံးပြုပါ။

အဆင့် 1: ဒေတာအတွဲကို ဖန်တီးပါ။

 import pandas as pd

data = {'assists': [4, 5, 5, 6, 7, 8, 8, 10],
        'rebounds': [12, 14, 13, 7, 8, 8, 9, 13],
        'points': [22, 24, 26, 26, 29, 32, 20, 14]
        }

df = pd. DataFrame (data, columns=['assists','rebounds','points'])
df

   assist rebound points
0 4 12 22
1 5 14 24
2 5 13 26
3 6 7 26
4 7 8 29
5 8 8 32
6 8 9 20
7 10 13 14

အဆင့် 2- ဆက်စပ်မက်ထရစ်ကို ဖန်တီးပါ။

 #create correlation matrix
df. corr ()

                assists rebound points
assists 1.000000 -0.244861 -0.329573
rebounds -0.244861 1.000000 -0.522092
points -0.329573 -0.522092 1.000000

#create same correlation matrix with coefficients rounded to 3 decimals 
df. corr (). round (3)
	       assists rebound points
assists 1.000 -0.245 -0.330
rebounds -0.245 1.000 -0.522
points -0.330 -0.522 1.000

အဆင့် 3- ဆက်စပ်မက်ထရစ်ကို အဓိပါယ်ဖွင့်ပါ။

ကိန်းရှင်တစ်ခုစီသည် သူ့ဘာသာသူနှင့် လုံးဝဆက်စပ်နေသောကြောင့် ဇယား၏ထောင့်ဖြတ်တစ်လျှောက်ရှိ ဆက်စပ်ကိန်းများကို 1 နှင့် ညီမျှသည်။

အခြားဆက်စပ်ဆက်စပ်ကိန်းများ အားလုံးသည် မတူညီသော အတွဲအစပ် ပေါင်းစပ်ကိန်းရှင်များကြား ဆက်စပ်မှုကို ညွှန်ပြသည်။ ဥပမာအားဖြင့်:

  • ကူညီပေးခြင်းနှင့် ပြန်ခုန်ခြင်းကြား ဆက်စပ်ကိန်းသည် -0.245 ဖြစ်သည်။
  • အကူအညီနှင့် ရမှတ်များကြား ဆက်စပ်ကိန်းသည် -0.330 ဖြစ်သည်။
  • ပြန်လှန်ခြင်းနှင့် အမှတ်များကြား ဆက်စပ်ကိန်းသည် -0.522 ဖြစ်သည်။

အဆင့် 4- ဆက်စပ်မက်ထရစ်ကို မြင်ယောင်ကြည့်ပါ (ချန်လှပ်ထားနိုင်သည်)။

ပန်ဒါများတွင် ရရှိနိုင်သော စတိုင်လ်ရွေးချယ်စရာများကို အသုံးပြု၍ ဆက်စပ်မက်ထရစ်ကို သင်မြင်ယောင်နိုင်သည်-

 corr = df. corr ()
corr. style . background_gradient (cmap='coolwarm')

Python ရှိ Correlation Matrix

မတူညီသောအရောင်များဖြင့် ဆက်စပ်မက်ထရစ်ကိုထုတ်လုပ်ရန် cmap အကြောင်းပြချက်ကိုလည်း သင်မွမ်းမံနိုင်သည်။

 corr = df. corr ()
corr. style . background_gradient (cmap=' RdYlGn ') 

Python ရှိ matplotlib နှင့် ဆက်စပ်မက်ထရစ်

 corr = df. corr ()
corr. style . background_gradient (cmap=' bwr ') 

Pandas ကို အသုံးပြု၍ ဆက်စပ်မက်ထရစ်

 corr = df. corr ()
corr. style . background_gradient (cmap=' PuOr ') 

Python ရှိ Correlation Matrix ဥပမာ

မှတ်ချက်cmap အငြင်းအခုံများစာရင်း အပြည့်အစုံအတွက် matplotlib စာရွက်စာတမ်းကို ကြည့်ပါ။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်