Category: လမ်းညွှန်

အမျိုးမျိုးသော variable များဖြင့် ggplot2 တွင် barplot ကိုဖန်တီးနည်း

Barplot သည် မတူညီသော အမျိုးအစားအလိုက် ကိန်းရှင်များ၏ ပမာဏများကို မြင်ယောင်ရန် အသုံးဝင်သည်။ တစ်ခါတစ်ရံတွင် ကျွန်ုပ်တို့သည် အုပ်စုခွဲများခွဲ၍ အမျိုးအစားခွဲထားသော ကိန်းရှင်ပမာဏများကို မြင်ယောင်နိုင်သော barplot တစ်ခုကို ဖန်တီးလိုပါသည်။ ဥပမာအားဖြင့်၊ မတူညီသော အားကစားကွင်းသုံးခုအတွက် ပေါက်ပေါက်နှင့် ဆိုဒါ စုစုပေါင်းရောင်းချမှုကို ကျွန်ုပ်တို့ မြင်ယောင်ကြည့်လိုပေမည်။ ဤသင်ခန်းစာတွင် ကိန်းရှင်များစွာဖြင့် အောက်ပါ barplot ကိုဖန်တီးနည်း အဆင့်ဆင့် ဥပမာကို ပေးသည်- အဆင့် 1: ဒေတာကိုဖန်တီးပါ။ ပထမဦးစွာ၊ ကျွန်ုပ်တို့၏ဒေတာကို ထိန်းသိမ်းရန် ဒေတာဘောင်တစ်ခု ဖန်တီးကြပါစို့။...

Z ရမှတ်များကို အဓိပ္ပါယ်ပြန်ဆိုပုံ- ဥပမာများဖြင့်

စာရင်းဇယားများတွင်၊ z-score သည် ပေးထားသောတန်ဖိုးသည် ပျမ်းမျှ ထံမှ စံသွေဖည်မည်မျှရှိသည်ကို ပြောပြသည်။ z-score ကိုတွက်ချက်ရန် အောက်ပါဖော်မြူလာကို ကျွန်ုပ်တို့အသုံးပြုသည်- z = (X – μ) / σ ရွှေ- X သည် ဒေတာအကြမ်းတစ်ခုတည်းတန်ဖိုးဖြစ်သည်။ µ သည် ပျမ်းမျှဖြစ်သည်။ σ သည် စံသွေဖည်သည်။ တစ်ဦးချင်းတန်ဖိုးအတွက် z-score ကို အောက်ပါအတိုင်း အဓိပ္ပာယ်ဖွင့်ဆိုနိုင်သည်- အပြုသဘော z-ရမှတ်- တစ်ဦးချင်းတန်ဖိုးသည် ပျမ်းမျှအထက်ဖြစ်သည်။ အနုတ်လက္ခဏာ z-ရမှတ်- တစ်ဦးချင်းတန်ဖိုးသည်...

Python တွင် mean absolute error တွက်ချက်နည်း

ကိန်းဂဏန်းစာရင်းဇယားများတွင် ဆိုလိုသည်မှာ အကြွင်းမဲ့အမှား (MAE) သည် ပေးထားသော မော်ဒယ်တစ်ခု၏ တိကျမှုကို တိုင်းတာသည့်နည်းလမ်းဖြစ်သည်။ အောက်ပါအတိုင်း တွက်ချက်သည်။ MAE = (1/n) * Σ|y i – x i | ရွှေ- Σ- “ ပေါင်း” ဟု အဓိပ္ပာယ်ရသော ဂရိသင်္ကေတ y i : ith observation အတွက် မှတ်သားထားသောတန်ဖိုး x i : ith observation အတွက်...

လူဦးရေအချိုးအစားက ဘယ်လောက်လဲ။

စာရင်းဇယားများတွင် လူဦးရေအချိုးအစားသည် အချို့သောလက္ခဏာရပ်များရှိသည့် လူ ဦးရေ၏အပိုင်းကို ရည်ညွှန်းသည်။ ဥပမာအားဖြင့်၊ အချို့မြို့များတွင်နေထိုင်သူ 43.8% သည် ဥပဒေအသစ်ကို ထောက်ခံသည်ဆိုပါစို့။ တန်ဖိုး 0.438 သည် လူဦးရေအချိုးအစားကို ကိုယ်စားပြုသည်။ လူဦးရေအချိုးအစားအတွက် ဖော်မြူလာ လူဦးရေအချိုးအစားသည် အမြဲတမ်း 0 နှင့် 1 ကြား (သို့မဟုတ် 0% မှ 100% ရာခိုင်နှုန်း) ဖြစ်ပြီး အောက်ပါအတိုင်း တွက်ချက်သည်- p = X / N ရွှေ- p- လူဦးရေအချိုး...

အတန်းနယ်နိမိတ်များကို ရှာဖွေနည်း- ဥပမာများဖြင့်

ကြိမ်နှုန်းခွဲဝေမှုတွင်၊ class boundaries များသည် class များကို ခွဲခြားထားသော တန်ဖိုးများဖြစ်သည်။ ကျွန်ုပ်တို့သည် ကြိမ်နှုန်းခွဲဝေမှုတွင် အတန်းနယ်နိမိတ်များကို တွက်ချက်ရန် အောက်ပါအဆင့်များကို အသုံးပြုသည်- 1. ပထမတန်း၏ အထက်ကန့်သတ်ချက်ကို ဒုတိယတန်းစား၏ အောက်ကန့်သတ်ချက်မှ နုတ်ပါ။ 2. ရလဒ်ကို နှစ်ပိုင်းခွဲပါ။ 3. အောက်တန်းကန့်သတ်ချက်မှ ရလဒ်ကို နုတ်ပြီး အတန်းတစ်ခုစီ၏ အထက်ကန့်သတ်ချက်သို့ ရလဒ်ကို ထည့်ပါ။ အောက်ဖော်ပြပါ ဥပမာများသည် ကြိမ်နှုန်းခွဲဝေမှုတွင် အတန်းကန့်သတ်ချက်များကို တွက်ချက်ရန် ဤအဆင့်များကို လက်တွေ့တွင် မည်သို့အသုံးပြုရမည်ကို ပြသထားသည်။ ဥပမာ...

Sturges ဆိုတာဘာလဲ။ ပေတံ? (အဓိပ္ပါယ် & #038; ဥပမာ)

ဟီစတိုဂရမ် တစ်ခုသည် ဒေတာအစုတစ်ခုတွင် တန်ဖိုးများဖြန့်ဝေမှုကို မြင်သာစေရန် ကူညီပေးသည့် ဂရပ်တစ်ခုဖြစ်သည်။ Histogram တွင်အသုံးပြုသော box အရေအတွက်များသည် ဒေတာကိုကျွန်ုပ်တို့ဘာသာပြန်ဆိုပုံအပေါ် ကြီးမားသောအကျိုးသက်ရောက်မှုရှိနိုင်သည်ကိုတွေ့ရှိရပါသည်။ အကယ်၍ ကျွန်ုပ်တို့သည် အုပ်စုများ အလွန်နည်းပါးပါက၊ ဒေတာရှိ စစ်မှန်သော နောက်ခံပုံစံကို ဖျောက်ထားနိုင်သည်- အကယ်၍ ကျွန်ုပ်တို့သည် အုပ်စုများစွာကို အသုံးပြုပါက၊ ဒေတာအတွဲတစ်ခုတွင် ဆူညံသံကို ရိုးရိုးရှင်းရှင်းမြင်ယောင်နိုင်သည်- ကံကောင်းထောက်မစွာ၊ ကျွန်ုပ်တို့သည် ဟီစတိုဂရမ်တစ်ခုတွင် အသုံးပြုရန် အကောင်းဆုံးသေတ္တာအရေအတွက်ကို ဆုံးဖြတ်ရန် Sturges’ rule ဟုခေါ်သော နည်းလမ်းကို အသုံးပြုနိုင်ပါသည်။ Sturges ၏စည်းမျဉ်းသည်...

ဘယ် သို့မဟုတ် ညာ လှည့်၍ ဖြန့်သည်။

Skewness သည် ဖြန့်ဖြူးမှုတစ်ခု၏ symmetry ကိုဖော်ပြသည့်နည်းလမ်းတစ်ခုဖြစ်သည်။ ဖြန့်ဖြူးမှု၏ဘယ်ဘက်ခြမ်းတွင် “ အမြီး” ပါရှိပါက ဖြန့်ဖြူးမှု အား လှည့်စားသည် – ဖြန့်ဖြူးမှု၏ညာဘက်ခြမ်းတွင် “အမြီး” ပါရှိပါက ဖြန့်ချီရေးသည် ညာဘက်စောင်းသည် – ဖြန့်ချီမှုတစ်ခုသည် နှစ်ဖက်စလုံးတွင် အချိုးညီပါက ဘက်လိုက်မှုမရှိပါ ။ ဘယ်ဘက်စောင်းစောင်း ဖြန့်ဝေမှုများကို တစ်ခါတစ်ရံ “ အပျက်သဘောဆောင်သော လှည့်ဖြားခြင်း” ဖြန့်ဝေမှုများဟု ခေါ်ဆိုကြပြီး ညာစောင်းစောင်းဖြန့်ဝေမှုများကို တစ်ခါတစ်ရံ “ အပြုသဘောဖြင့် လှည့်စားခြင်း” ဖြန့်ဝေမှုများဟု ခေါ်ဆိုကြောင်း သတိပြုပါ။ ကွဲလွဲနေသော...

Pandas ရှိ ကော်လံများစွာအတွက် na တန်ဖိုးများကို ဖြည့်နည်း

pandas fillna() function သည် pandas DataFrame ကော်လံများတွင် ပျောက်ဆုံးနေသောတန်ဖိုးများကိုဖြည့်ရန်အတွက် အသုံးဝင်သည်။ ဤသင်ခန်းစာသည် အောက်ပါပန်ဒါ DataFrame ရှိ ကော်လံအများအပြားအတွက် ပျောက်ဆုံးနေသောတန်ဖိုးများကိုဖြည့်ရန် ဤလုပ်ဆောင်ချက်ကိုအသုံးပြုခြင်း၏နမူနာများစွာကို ပေးဆောင်သည်- import pandas as pd import numpy as np #createDataFrame df = pd. DataFrame ({'team': ['A', np. nan , 'B', 'B', 'B', 'C', 'C', 'C'],...

Python တွင် mann-kendall trend test ကို မည်သို့လုပ်ဆောင်ရမည်နည်း။

Mann-Kendall trend test ကို time series data မှာ trend ရှိ/မရှိ ဆုံးဖြတ်ဖို့ သုံးပါတယ်။ ဤသည်မှာ ပါရာမက်ထရစ်မဟုတ်သော စမ်းသပ်မှုဖြစ်ပြီး၊ ဆိုလိုသည်မှာ ဒေတာ၏ ပုံမှန်ဖြစ်တည်မှုနှင့် ပတ်သက်၍ နောက်ခံယူဆချက်များ မပြုလုပ်ရပါ။ စမ်းသပ်မှုယူဆချက်မှာ အောက်ပါအတိုင်းဖြစ်သည်။ H 0 (null hypothesis): ဒေတာတွင် လမ်းကြောင်းမရှိပေ။ H A (အစားထိုးယူဆချက်)- လမ်းကြောင်းတစ်ခုသည် ဒေတာတွင် ရှိနေသည်။ (ဒါက အပြုသဘော ဒါမှမဟုတ် အဆိုးမြင်လမ်းကြောင်း ဖြစ်နိုင်ပါတယ်) အကယ်၍...

Seaborn ဖြင့် အပူမြေပုံများဖန်တီးနည်း (ဥပမာများနှင့်အတူ)

အပူမြေပုံ သည် ဒေတာတန်ဖိုးများကို ကိုယ်စားပြုရန်အတွက် မတူညီသောအရောင်များကို အသုံးပြုသည့် ဇယားအမျိုးအစားတစ်ခုဖြစ်သည်။ ဤသင်ခန်းစာတွင် အောက်ပါဒေတာအတွဲဖြင့် Seaborn Python visualization library ကို အသုံးပြု၍ အပူမြေပုံများဖန်တီးနည်းကို ရှင်းပြထားသည်။ #import seaborn import seaborn as sns #load "flights" dataset data = sns. load_dataset (“ flights ”) data = data. pivot (" month ", "...