Pandas တွင် အုပ်စုအလိုက် ဟီစတိုဂရမ်များကို မည်သို့ဆွဲမည်နည်း။
ပန်ဒါ DataFrame တွင် အုပ်စုအလိုက် ဟီစတိုဂရမ်များဆွဲရန် အောက်ပါနည်းလမ်းများကို သင်အသုံးပြုနိုင်ပါသည်။
နည်းလမ်း 1- ကွက်များစွာကို အသုံးပြု၍ အုပ်စုအလိုက် ဟီစတိုဂရမ်များကို ရေးဆွဲပါ။
df[' values_var ']. hist (by=df[' group_var '])
နည်းလမ်း 2- ကွက်ကွက်တစ်ခုတည်းကို အသုံးပြု၍ အုပ်စုအလိုက် ဟစ်စတိုဂရမ်များကို ချပါ။
plt. hist (group1, alpha= 0.5 , label=' group1 ') plt. hist (group2, alpha= 0.5 , label=' group2 ') plt. hist (group3, alpha= 0.5 , label=' group3 ')
အောက်ပါဥပမာများသည် မတူညီသောအသင်းသုံးသင်းမှ ဘတ်စကက်ဘောကစားသမားများမှ ရမှတ်များကိုပြသသည့် အောက်ပါပန်ဒါ DataFrame ဖြင့် လက်တွေ့တွင် နည်းလမ်းတစ်ခုစီကို အသုံးပြုနည်းကို ပြသသည်-
import pandas as pd import numpy as np #make this example reproducible n.p. random . seeds (1) #createDataFrame df = pd. DataFrame ({' team ': np.repeat ([' A ',' B ',' C '], 100 ), ' points ': np. random . normal (loc= 20 , scale= 2 , size= 300 )}) #view head of DataFrame print ( df.head ()) team points 0 A 23.248691 1 A 18.776487 2 A 18.943656 3 A 17.854063 4 A 21.730815
ဥပမာ 1- ကွက်များစွာကို အသုံးပြု၍ အုပ်စုအလိုက် ဟစ်စတိုဂရမ်များကို ချပါ။
အောက်ဖော်ပြပါကုဒ်သည် အသင်းသုံးသင်းမှ ကစားသမားများမှ ရမှတ်များခွဲဝေမှုဖော်ပြသည့် ဟီစတိုဂရမ် သုံးခုကို ဖန်တီးနည်းကို ပြသသည်-
#create histograms of points by team df[' points ']. hist (by=df[' team '])
မြင်သာလွယ်စေရန် histogram တစ်ခုစီ၏ အရွယ်အစားကို တိုးမြင့်ရန်အတွက် အစွန်း လိုင်းများကို ပေါင်းထည့်ရန် edgecolor အငြင်းအခုံကို အသုံးပြုနိုင်ပါသည်-
#create histograms of points by team df[' points ']. hist (by=df[' team '], edgecolor=' black ', figsize = ( 8 , 6 ))
ဥပမာ 2- ကွက်ကွက်တစ်ခုတည်းကို အသုံးပြု၍ အုပ်စုအလိုက် ဟစ်စတိုဂရမ်များကို ဆွဲပါ။
အောက်ပါကုဒ်သည် ဟစ်စတိုဂရမ် သုံးခုဖန်တီးနည်းကို ပြသပြီး ၎င်းတို့အားလုံးကို တူညီသောကွက်လပ်ပေါ်တွင် နေရာချပါ။
import matplotlib.pyplot as plt
#define points values by group
A = df. loc [df[' team '] == ' A ', ' points ']
B = df. loc [df[' team '] == ' B ', ' points ']
C = df. loc [df[' team '] == ' C ', ' points ']
#add three histograms to one plot
plt. hist (A, alpha= 0.5 , label=' A ')
plt. hist (B, alpha= 0.5 , label=' B ')
plt. hist (C, alpha= 0.5 , label=' C ')
#add plot title and axis labels
plt. title (' Points Distribution by Team ')
plt. xlabel (' Points ')
plt. ylabel (' Frequency ')
#add legend
plt. legend (title=' Team ')
#displayplot
plt. show ()
နောက်ဆုံးရလဒ်မှာ တစ်ခုနှင့်တစ်ခုအပေါ်တွင် စီထားသော ဟစ်စတိုဂရမ်သုံးခုကို ပြသသည့် ကွက်ကွက်တစ်ခုဖြစ်သည်။
မှတ်ချက် – အယ်လ်ဖာ အငြင်းအခုံသည် ဟီစတိုဂရမ်တစ်ခုစီ၏ ပွင့်လင်းမြင်သာမှုကို ဖော်ပြသည်။ ဤတန်ဖိုးသည် 0 မှ 1 အထိ ကွာဟနိုင်သည်။ ဤတန်ဖိုးကို 0.5 နှင့် ညီအောင် သတ်မှတ်ခြင်းဖြင့်၊ ထပ်ထားသော histogram တစ်ခုစီကို ကျွန်ုပ်တို့ ပိုမိုကောင်းမွန်စွာ မြင်နိုင်သည်။
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ပါသင်ခန်းစာများသည် Python တွင် အခြားဘုံကွက်ကွက်များဖန်တီးနည်းကို ရှင်းပြသည်-
Matplotlib တွင် စာကြောင်းများစွာကို ဘယ်လိုဆွဲမလဲ။
Pandas DataFrame မှ boxplot တစ်ခုကို ဖန်တီးနည်း
ဘားဇယားတစ်ခုပေါ်တွင် Pandas ကော်လံများစွာကို ဘယ်လိုဆွဲမလဲ။