Python တွင် ကျောင်းသားဖြစ်ထားသော အကြွင်းအကျန်များကို တွက်ချက်နည်း


ကျောင်းသားအကြွင်းအကျန် သည် ၎င်း၏ခန့်မှန်းစံသွေဖည်မှုဖြင့် ပိုင်းခြားထားသော အကြွင်းတစ်ခုဖြစ်သည်။

လက်တွေ့တွင်၊ ကျောင်းသားအကြွင်းအကျန်သည် 3 ၏ ပကတိတန်ဖိုးထက် ပိုများသော ဒေတာအတွဲတစ်ခုတွင် စောင့်ကြည့်မှု တိုင်းသည် သာလွန်သည်ဟု ကျွန်ုပ်တို့ယေဘုယျအားဖြင့် ဆိုကြသည်။

အောက်ပါ syntax ကိုအသုံးပြုသည့် statsmodels ၏ OLSResults.outlier_test() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ Python ရှိ ဆုတ်ယုတ်မှုပုံစံ၏ ကျောင်းသားဖြစ်ကျန်နေသေးသော အကြွင်းအကျန်များကို ကျွန်ုပ်တို့ အမြန်ရနိုင်သည်-

OLSResults.outlier_test()

OLSResults သည် statsmodels ols() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ ကိုက်ညီသော linear model တစ်ခု၏ အမည်ဖြစ်သည်။

ဥပမာ- Python တွင် ကျောင်းသားဖြစ်ကျန်နေသေးသော တွက်ချက်မှု

Python တွင် အောက်ပါ ရိုးရှင်းသော linear regression model ကို ကျွန်ုပ်တို့တည်ဆောက်သည်ဆိုပါစို့။

 #import necessary packages and functions
import numpy as np
import pandas as pd
import statsmodels. api as sm
from statsmodels. formula . api import ols

#create dataset
df = pd. DataFrame ({'rating': [90, 85, 82, 88, 94, 90, 76, 75, 87, 86],
                   'points': [25, 20, 14, 16, 27, 20, 12, 15, 14, 19]})

#fit simple linear regression model
model = ols('rating ~ points', data=df). fit ()

ဒေတာအတွဲတွင် လေ့လာမှုတစ်ခုစီအတွက် ကျောင်းသားဖြစ်ကျန်နေသေးသော DataFrame တစ်ခုထုတ်လုပ်ရန် outlier_test() လုပ်ဆောင်ချက်ကို ကျွန်ုပ်တို့အသုံးပြုနိုင်သည်-

 #calculate studentized residuals
stud_res = model. outlier_test ()

#display studentized residuals
print(stud_res)

    student_resid unadj_p bonf(p)
0 -0.486471 0.641494 1.000000
1 -0.491937 0.637814 1.000000
2 0.172006 0.868300 1.000000
3 1.287711 0.238781 1.000000
4 0.106923 0.917850 1.000000
5 0.748842 0.478355 1.000000
6 -0.968124 0.365234 1.000000
7 -2.409911 0.046780 0.467801
8 1.688046 0.135258 1.000000
9 -0.014163 0.989095 1.000000

ဤ DataFrame သည် dataset တွင်ကြည့်ရှုမှုတစ်ခုစီအတွက်အောက်ပါတန်ဖိုးများကိုပြသသည်-

  • ကျောင်သားအကြွင်းအကျန်
  • ကျောင်းသားအဖြစ်မှ ကျန်ရှိသော p-value ကို ချိန်ညှိမထားသော p-value
  • ကျန်ရှိသော ကျောင်းသား၏ Bonferroni-ပြင်ဆင်ထားသော p-တန်ဖိုး

ဒေတာအတွဲတွင် ပထမလေ့လာချက်အတွက် ကျောင်းသားဖြစ်ကျန်ကျန်သည် -0.486471 ၊ ဒုတိယလေ့လာရေးအတွက် ကျောင်းသားကျန်ကျန်သည် -0.491937 စသည်တို့ဖြစ်သည်။

သက်ဆိုင်သော ကျောင်းသားပြုထားသော အကြွင်းအကျန်များနှင့် ပတ်သက်သော ကြိုတင်ခန့်မှန်းကိန်းရှင်များ၏ တန်ဖိုးများကို အမြန်ကွက်ကွက် ဖန်တီးနိုင်သည်။

 import matplotlib. pyplot as plt

#define predictor variable values and studentized residuals
x = df[' points ']
y = stud_res[' student_resid ']

#create scatterplot of predictor variable vs. studentized residuals
plt. scatter (x,y)
plt. axhline (y=0, color=' black ', linestyle=' -- ')
plt. xlabel (' Points ')
plt. ylabel (' Studentized Residuals ') 

Python တွင် ကျောင်းသားအကြွင်းအကျန်များ

ဂရပ်မှလေ့လာတွေ့ရှိချက်များတွင် 3 ထက်ကြီးသော ပကတိတန်ဖိုးရှိသော ကျောင်းသားအကြွင်းအကျန်မရှိသည်ကို ကျွန်ုပ်တို့တွေ့မြင်နိုင်သည်၊ ထို့ကြောင့် ဒေတာအတွဲတွင် ရှင်းရှင်းလင်းလင်းအစွန်းအထင်းများမရှိပါ။

ထပ်လောင်းအရင်းအမြစ်များ

Python တွင် ရိုးရှင်းသော linear regression လုပ်နည်း
Python တွင် မျဉ်းကြောင်း ဆုတ်ယုတ်မှု အများအပြား လုပ်ဆောင်နည်း
Python တွင် Residual Plot ဖန်တီးနည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်