Category: လမ်းညွှန်
Barplot သည် မတူညီသော အမျိုးအစားအလိုက် ကိန်းရှင်များ၏ ပမာဏများကို မြင်ယောင်ရန် အသုံးဝင်သည်။ တစ်ခါတစ်ရံတွင် ကျွန်ုပ်တို့သည် အုပ်စုခွဲများခွဲ၍ အမျိုးအစားခွဲထားသော ကိန်းရှင်ပမာဏများကို မြင်ယောင်နိုင်သော barplot တစ်ခုကို ဖန်တီးလိုပါသည်။ ဥပမာအားဖြင့်၊ မတူညီသော အားကစားကွင်းသုံးခုအတွက် ပေါက်ပေါက်နှင့် ဆိုဒါ စုစုပေါင်းရောင်းချမှုကို ကျွန်ုပ်တို့ မြင်ယောင်ကြည့်လိုပေမည်။ ဤသင်ခန်းစာတွင် ကိန်းရှင်များစွာဖြင့် အောက်ပါ barplot ကိုဖန်တီးနည်း အဆင့်ဆင့် ဥပမာကို ပေးသည်- အဆင့် 1: ဒေတာကိုဖန်တီးပါ။ ပထမဦးစွာ၊ ကျွန်ုပ်တို့၏ဒေတာကို ထိန်းသိမ်းရန် ဒေတာဘောင်တစ်ခု ဖန်တီးကြပါစို့။...
စာရင်းဇယားများတွင်၊ z-score သည် ပေးထားသောတန်ဖိုးသည် ပျမ်းမျှ ထံမှ စံသွေဖည်မည်မျှရှိသည်ကို ပြောပြသည်။ z-score ကိုတွက်ချက်ရန် အောက်ပါဖော်မြူလာကို ကျွန်ုပ်တို့အသုံးပြုသည်- z = (X – μ) / σ ရွှေ- X သည် ဒေတာအကြမ်းတစ်ခုတည်းတန်ဖိုးဖြစ်သည်။ µ သည် ပျမ်းမျှဖြစ်သည်။ σ သည် စံသွေဖည်သည်။ တစ်ဦးချင်းတန်ဖိုးအတွက် z-score ကို အောက်ပါအတိုင်း အဓိပ္ပာယ်ဖွင့်ဆိုနိုင်သည်- အပြုသဘော z-ရမှတ်- တစ်ဦးချင်းတန်ဖိုးသည် ပျမ်းမျှအထက်ဖြစ်သည်။ အနုတ်လက္ခဏာ z-ရမှတ်- တစ်ဦးချင်းတန်ဖိုးသည်...
ကိန်းဂဏန်းစာရင်းဇယားများတွင် ဆိုလိုသည်မှာ အကြွင်းမဲ့အမှား (MAE) သည် ပေးထားသော မော်ဒယ်တစ်ခု၏ တိကျမှုကို တိုင်းတာသည့်နည်းလမ်းဖြစ်သည်။ အောက်ပါအတိုင်း တွက်ချက်သည်။ MAE = (1/n) * Σ|y i – x i | ရွှေ- Σ- “ ပေါင်း” ဟု အဓိပ္ပာယ်ရသော ဂရိသင်္ကေတ y i : ith observation အတွက် မှတ်သားထားသောတန်ဖိုး x i : ith observation အတွက်...
စာရင်းဇယားများတွင် လူဦးရေအချိုးအစားသည် အချို့သောလက္ခဏာရပ်များရှိသည့် လူ ဦးရေ၏အပိုင်းကို ရည်ညွှန်းသည်။ ဥပမာအားဖြင့်၊ အချို့မြို့များတွင်နေထိုင်သူ 43.8% သည် ဥပဒေအသစ်ကို ထောက်ခံသည်ဆိုပါစို့။ တန်ဖိုး 0.438 သည် လူဦးရေအချိုးအစားကို ကိုယ်စားပြုသည်။ လူဦးရေအချိုးအစားအတွက် ဖော်မြူလာ လူဦးရေအချိုးအစားသည် အမြဲတမ်း 0 နှင့် 1 ကြား (သို့မဟုတ် 0% မှ 100% ရာခိုင်နှုန်း) ဖြစ်ပြီး အောက်ပါအတိုင်း တွက်ချက်သည်- p = X / N ရွှေ- p- လူဦးရေအချိုး...
ကြိမ်နှုန်းခွဲဝေမှုတွင်၊ class boundaries များသည် class များကို ခွဲခြားထားသော တန်ဖိုးများဖြစ်သည်။ ကျွန်ုပ်တို့သည် ကြိမ်နှုန်းခွဲဝေမှုတွင် အတန်းနယ်နိမိတ်များကို တွက်ချက်ရန် အောက်ပါအဆင့်များကို အသုံးပြုသည်- 1. ပထမတန်း၏ အထက်ကန့်သတ်ချက်ကို ဒုတိယတန်းစား၏ အောက်ကန့်သတ်ချက်မှ နုတ်ပါ။ 2. ရလဒ်ကို နှစ်ပိုင်းခွဲပါ။ 3. အောက်တန်းကန့်သတ်ချက်မှ ရလဒ်ကို နုတ်ပြီး အတန်းတစ်ခုစီ၏ အထက်ကန့်သတ်ချက်သို့ ရလဒ်ကို ထည့်ပါ။ အောက်ဖော်ပြပါ ဥပမာများသည် ကြိမ်နှုန်းခွဲဝေမှုတွင် အတန်းကန့်သတ်ချက်များကို တွက်ချက်ရန် ဤအဆင့်များကို လက်တွေ့တွင် မည်သို့အသုံးပြုရမည်ကို ပြသထားသည်။ ဥပမာ...
ဟီစတိုဂရမ် တစ်ခုသည် ဒေတာအစုတစ်ခုတွင် တန်ဖိုးများဖြန့်ဝေမှုကို မြင်သာစေရန် ကူညီပေးသည့် ဂရပ်တစ်ခုဖြစ်သည်။ Histogram တွင်အသုံးပြုသော box အရေအတွက်များသည် ဒေတာကိုကျွန်ုပ်တို့ဘာသာပြန်ဆိုပုံအပေါ် ကြီးမားသောအကျိုးသက်ရောက်မှုရှိနိုင်သည်ကိုတွေ့ရှိရပါသည်။ အကယ်၍ ကျွန်ုပ်တို့သည် အုပ်စုများ အလွန်နည်းပါးပါက၊ ဒေတာရှိ စစ်မှန်သော နောက်ခံပုံစံကို ဖျောက်ထားနိုင်သည်- အကယ်၍ ကျွန်ုပ်တို့သည် အုပ်စုများစွာကို အသုံးပြုပါက၊ ဒေတာအတွဲတစ်ခုတွင် ဆူညံသံကို ရိုးရိုးရှင်းရှင်းမြင်ယောင်နိုင်သည်- ကံကောင်းထောက်မစွာ၊ ကျွန်ုပ်တို့သည် ဟီစတိုဂရမ်တစ်ခုတွင် အသုံးပြုရန် အကောင်းဆုံးသေတ္တာအရေအတွက်ကို ဆုံးဖြတ်ရန် Sturges’ rule ဟုခေါ်သော နည်းလမ်းကို အသုံးပြုနိုင်ပါသည်။ Sturges ၏စည်းမျဉ်းသည်...
Skewness သည် ဖြန့်ဖြူးမှုတစ်ခု၏ symmetry ကိုဖော်ပြသည့်နည်းလမ်းတစ်ခုဖြစ်သည်။ ဖြန့်ဖြူးမှု၏ဘယ်ဘက်ခြမ်းတွင် “ အမြီး” ပါရှိပါက ဖြန့်ဖြူးမှု အား လှည့်စားသည် – ဖြန့်ဖြူးမှု၏ညာဘက်ခြမ်းတွင် “အမြီး” ပါရှိပါက ဖြန့်ချီရေးသည် ညာဘက်စောင်းသည် – ဖြန့်ချီမှုတစ်ခုသည် နှစ်ဖက်စလုံးတွင် အချိုးညီပါက ဘက်လိုက်မှုမရှိပါ ။ ဘယ်ဘက်စောင်းစောင်း ဖြန့်ဝေမှုများကို တစ်ခါတစ်ရံ “ အပျက်သဘောဆောင်သော လှည့်ဖြားခြင်း” ဖြန့်ဝေမှုများဟု ခေါ်ဆိုကြပြီး ညာစောင်းစောင်းဖြန့်ဝေမှုများကို တစ်ခါတစ်ရံ “ အပြုသဘောဖြင့် လှည့်စားခြင်း” ဖြန့်ဝေမှုများဟု ခေါ်ဆိုကြောင်း သတိပြုပါ။ ကွဲလွဲနေသော...
pandas fillna() function သည် pandas DataFrame ကော်လံများတွင် ပျောက်ဆုံးနေသောတန်ဖိုးများကိုဖြည့်ရန်အတွက် အသုံးဝင်သည်။ ဤသင်ခန်းစာသည် အောက်ပါပန်ဒါ DataFrame ရှိ ကော်လံအများအပြားအတွက် ပျောက်ဆုံးနေသောတန်ဖိုးများကိုဖြည့်ရန် ဤလုပ်ဆောင်ချက်ကိုအသုံးပြုခြင်း၏နမူနာများစွာကို ပေးဆောင်သည်- import pandas as pd import numpy as np #createDataFrame df = pd. DataFrame ({'team': ['A', np. nan , 'B', 'B', 'B', 'C', 'C', 'C'],...
Mann-Kendall trend test ကို time series data မှာ trend ရှိ/မရှိ ဆုံးဖြတ်ဖို့ သုံးပါတယ်။ ဤသည်မှာ ပါရာမက်ထရစ်မဟုတ်သော စမ်းသပ်မှုဖြစ်ပြီး၊ ဆိုလိုသည်မှာ ဒေတာ၏ ပုံမှန်ဖြစ်တည်မှုနှင့် ပတ်သက်၍ နောက်ခံယူဆချက်များ မပြုလုပ်ရပါ။ စမ်းသပ်မှုယူဆချက်မှာ အောက်ပါအတိုင်းဖြစ်သည်။ H 0 (null hypothesis): ဒေတာတွင် လမ်းကြောင်းမရှိပေ။ H A (အစားထိုးယူဆချက်)- လမ်းကြောင်းတစ်ခုသည် ဒေတာတွင် ရှိနေသည်။ (ဒါက အပြုသဘော ဒါမှမဟုတ် အဆိုးမြင်လမ်းကြောင်း ဖြစ်နိုင်ပါတယ်) အကယ်၍...
အပူမြေပုံ သည် ဒေတာတန်ဖိုးများကို ကိုယ်စားပြုရန်အတွက် မတူညီသောအရောင်များကို အသုံးပြုသည့် ဇယားအမျိုးအစားတစ်ခုဖြစ်သည်။ ဤသင်ခန်းစာတွင် အောက်ပါဒေတာအတွဲဖြင့် Seaborn Python visualization library ကို အသုံးပြု၍ အပူမြေပုံများဖန်တီးနည်းကို ရှင်းပြထားသည်။ #import seaborn import seaborn as sns #load "flights" dataset data = sns. load_dataset (“ flights ”) data = data. pivot (" month ", "...