Python တွင် မတူကွဲပြားသော ခွဲခြမ်းစိတ်ဖြာမှု ပြုလုပ်နည်း- ဥပမာများ


univariate analysis ဟူသော ဝေါဟာရသည် ကိန်းရှင်တစ်ခု၏ ခွဲခြမ်းစိတ်ဖြာမှုကို ရည်ညွှန်းသည်။ ရှေ့ဆက် “ uni” သည် “ one” ဖြစ်သောကြောင့်၎င်းကိုသင်မှတ်မိနိုင်သည်။

ကိန်းရှင်တစ်ခုပေါ်တွင် တစ်မူထူးခြားသော ခွဲခြမ်းစိတ်ဖြာမှုကို လုပ်ဆောင်ရန် ဘုံနည်းလမ်းသုံးမျိုးရှိပါသည်။

1. အကျဉ်းချုပ်စာရင်းအင်းများ – တန်ဖိုးများကို ဗဟိုချက်နှင့် ဖြန့်ဖြူးမှုကို တိုင်းတာသည်။

2. ကြိမ်နှုန်းဇယား – မတူညီသောတန်ဖိုးများ မည်မျှပေါ်လာသည်ကို ဖော်ပြသည်။

3. ဇယားများ – တန်ဖိုးများ ဖြန့်ဖြူးမှုကို မြင်သာစေရန် အသုံးပြုသည်။

ဤသင်ခန်းစာသည် အောက်ဖော်ပြပါ ပန်ဒါများ DataFrame ဖြင့် တစ်မူထူးခြားသော ခွဲခြမ်းစိတ်ဖြာမှုကို မည်သို့လုပ်ဆောင်ရမည်ကို ဥပမာပေးထားပါသည်။

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' points ': [1, 1, 2, 3.5, 4, 4, 4, 5, 5, 6.5, 7, 7.4, 8, 13, 14.2],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4, 6, 8, 8, 9, 3, 2, 6],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12, 6, 6, 7, 8, 7, 9, 15]})

#view first five rows of DataFrame
df. head ()

	points assists rebounds
0 1.0 5 11
1 1.0 7 8
2 2.0 7 10
3 3.5 9 6
4 4.0 12 6

1. အနှစ်ချုပ်စာရင်းဇယားတွက်ချက်

DataFrame ရှိ “ points” variable အတွက် အမျိုးမျိုးသော အနှစ်ချုပ်ကိန်းဂဏန်းများကို တွက်ချက်ရန် အောက်ပါ syntax ကို အသုံးပြုနိုင်ပါသည်။

 #calculate mean of 'points'
df[' points ']. mean ()

5.706666666666667

#calculate median of 'points' 
df[' points ']. median () 

5.0

#calculate standard deviation of 'points'
df[' points ']. std () 

3.858287308169384

2. ကြိမ်နှုန်းဇယားတစ်ခုဖန်တီးပါ။

ကျွန်ုပ်တို့သည် ပြောင်းလဲနိုင်သော ‘အမှတ်များ’ အတွက် ကြိမ်နှုန်းဇယားတစ်ခုဖန်တီးရန် အောက်ပါ syntax ကို အသုံးပြုနိုင်ပါသည်။

 #create frequency table for 'points'
df[' points ']. value_counts ()

4.0 3
1.0 2
5.0 2
2.0 1
3.5 1
6.5 1
7.0 1
7.4 1
8.0 1
13.0 1
14.2 1
Name: points, dtype: int64

၎င်းသည် ကျွန်ုပ်တို့အား ပြောပြသည်-

  • တန်ဖိုး 4 သည် 3 ကြိမ်ပေါ်လာသည်။
  • တန်ဖိုး 1 သည် နှစ်ခါပေါ်လာသည်။
  • တန်ဖိုး 5 သည် နှစ်ခါပေါ်လာသည်။
  • တန်ဖိုး 2 သည် 1 ကြိမ်ပေါ်လာသည်။

နောက် … ပြီးတော့။

ဆက်စပ်- Python တွင် ကြိမ်နှုန်းဇယားများ ဖန်တီးနည်း

3. ဇယားများဖန်တီးပါ။

‘points’ variable အတွက် boxplot တစ်ခုကို ဖန်တီးရန် အောက်ပါ syntax ကို အသုံးပြုနိုင်ပါသည်။

 import matplotlib. pyplot as plt

df. boxplot (column=[' points '], grid= False , color=' black ')

ဆက်စပ်- Pandas DataFrame မှ Boxplot ဖန်တီးနည်း

‘points’ variable အတွက် histogram တစ်ခုကို ဖန်တီးရန် အောက်ပါ syntax ကို အသုံးပြုနိုင်ပါသည်။

 import matplotlib. pyplot as plt

df. hist (column=' points ', grid= False , edgecolor=' black ')

ဆက်စပ်- Pandas DataFrame မှ Histogram ဖန်တီးနည်း

“points” variable အတွက် သိပ်သည်းဆမျဉ်းကွေးကို ဖန်တီးရန် အောက်ပါ syntax ကို အသုံးပြုနိုင်ပါသည်။

 import seaborn as sns

sns. kdeplot (df[' points '])

ဆက်စပ်- Matplotlib တွင် သိပ်သည်းဆ Plot တစ်ခုကို ဖန်တီးနည်း

ဤဂရပ်တစ်ခုစီသည် “အမှတ်များ” variable ၏ တန်ဖိုးများ ဖြန့်ဖြူးမှုကို မြင်သာစေရန် ထူးခြားသောနည်းလမ်းကို ပေးပါသည်။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်