Python တွင် မတူကွဲပြားသော ခွဲခြမ်းစိတ်ဖြာမှု ပြုလုပ်နည်း- ဥပမာများ
univariate analysis ဟူသော ဝေါဟာရသည် ကိန်းရှင်တစ်ခု၏ ခွဲခြမ်းစိတ်ဖြာမှုကို ရည်ညွှန်းသည်။ ရှေ့ဆက် “ uni” သည် “ one” ဖြစ်သောကြောင့်၎င်းကိုသင်မှတ်မိနိုင်သည်။
ကိန်းရှင်တစ်ခုပေါ်တွင် တစ်မူထူးခြားသော ခွဲခြမ်းစိတ်ဖြာမှုကို လုပ်ဆောင်ရန် ဘုံနည်းလမ်းသုံးမျိုးရှိပါသည်။
1. အကျဉ်းချုပ်စာရင်းအင်းများ – တန်ဖိုးများကို ဗဟိုချက်နှင့် ဖြန့်ဖြူးမှုကို တိုင်းတာသည်။
2. ကြိမ်နှုန်းဇယား – မတူညီသောတန်ဖိုးများ မည်မျှပေါ်လာသည်ကို ဖော်ပြသည်။
3. ဇယားများ – တန်ဖိုးများ ဖြန့်ဖြူးမှုကို မြင်သာစေရန် အသုံးပြုသည်။
ဤသင်ခန်းစာသည် အောက်ဖော်ပြပါ ပန်ဒါများ DataFrame ဖြင့် တစ်မူထူးခြားသော ခွဲခြမ်းစိတ်ဖြာမှုကို မည်သို့လုပ်ဆောင်ရမည်ကို ဥပမာပေးထားပါသည်။
import pandas as pd #createDataFrame df = pd. DataFrame ({' points ': [1, 1, 2, 3.5, 4, 4, 4, 5, 5, 6.5, 7, 7.4, 8, 13, 14.2], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4, 6, 8, 8, 9, 3, 2, 6], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12, 6, 6, 7, 8, 7, 9, 15]}) #view first five rows of DataFrame df. head () points assists rebounds 0 1.0 5 11 1 1.0 7 8 2 2.0 7 10 3 3.5 9 6 4 4.0 12 6
1. အနှစ်ချုပ်စာရင်းဇယားတွက်ချက်
DataFrame ရှိ “ points” variable အတွက် အမျိုးမျိုးသော အနှစ်ချုပ်ကိန်းဂဏန်းများကို တွက်ချက်ရန် အောက်ပါ syntax ကို အသုံးပြုနိုင်ပါသည်။
#calculate mean of 'points' df[' points ']. mean () 5.706666666666667 #calculate median of 'points' df[' points ']. median () 5.0 #calculate standard deviation of 'points' df[' points ']. std () 3.858287308169384
2. ကြိမ်နှုန်းဇယားတစ်ခုဖန်တီးပါ။
ကျွန်ုပ်တို့သည် ပြောင်းလဲနိုင်သော ‘အမှတ်များ’ အတွက် ကြိမ်နှုန်းဇယားတစ်ခုဖန်တီးရန် အောက်ပါ syntax ကို အသုံးပြုနိုင်ပါသည်။
#create frequency table for 'points' df[' points ']. value_counts () 4.0 3 1.0 2 5.0 2 2.0 1 3.5 1 6.5 1 7.0 1 7.4 1 8.0 1 13.0 1 14.2 1 Name: points, dtype: int64
၎င်းသည် ကျွန်ုပ်တို့အား ပြောပြသည်-
- တန်ဖိုး 4 သည် 3 ကြိမ်ပေါ်လာသည်။
- တန်ဖိုး 1 သည် နှစ်ခါပေါ်လာသည်။
- တန်ဖိုး 5 သည် နှစ်ခါပေါ်လာသည်။
- တန်ဖိုး 2 သည် 1 ကြိမ်ပေါ်လာသည်။
နောက် … ပြီးတော့။
ဆက်စပ်- Python တွင် ကြိမ်နှုန်းဇယားများ ဖန်တီးနည်း
3. ဇယားများဖန်တီးပါ။
‘points’ variable အတွက် boxplot တစ်ခုကို ဖန်တီးရန် အောက်ပါ syntax ကို အသုံးပြုနိုင်ပါသည်။
import matplotlib. pyplot as plt df. boxplot (column=[' points '], grid= False , color=' black ')

ဆက်စပ်- Pandas DataFrame မှ Boxplot ဖန်တီးနည်း
‘points’ variable အတွက် histogram တစ်ခုကို ဖန်တီးရန် အောက်ပါ syntax ကို အသုံးပြုနိုင်ပါသည်။
import matplotlib. pyplot as plt df. hist (column=' points ', grid= False , edgecolor=' black ')

ဆက်စပ်- Pandas DataFrame မှ Histogram ဖန်တီးနည်း
“points” variable အတွက် သိပ်သည်းဆမျဉ်းကွေးကို ဖန်တီးရန် အောက်ပါ syntax ကို အသုံးပြုနိုင်ပါသည်။
import seaborn as sns sns. kdeplot (df[' points '])

ဆက်စပ်- Matplotlib တွင် သိပ်သည်းဆ Plot တစ်ခုကို ဖန်တီးနည်း
ဤဂရပ်တစ်ခုစီသည် “အမှတ်များ” variable ၏ တန်ဖိုးများ ဖြန့်ဖြူးမှုကို မြင်သာစေရန် ထူးခြားသောနည်းလမ်းကို ပေးပါသည်။