Pandas- မတူညီသောအရှည်များဖြင့် dict တစ်ခုမှ dataframe တစ်ခုကို ဖန်တီးပါ။
ထည့်သွင်းမှုများသည် အရှည်အမျိုးမျိုးရှိသည့် အဘိဓာန်တစ်ခုမှ ပန်ဒါ DataFrame တစ်ခုကို ဖန်တီးရန် အောက်ပါအခြေခံ syntax ကို အသုံးပြုနိုင်သည်။
import pandas as pd df = pd. DataFrame (dict([(key, pd. Series (value)) for key, value in some_dict. items ()]))
ဤ syntax သည် အဘိဓာန်အခင်းအကျင်းများစာရင်းကို ပန်ဒါစီးရီးများစာရင်းအဖြစ်သို့ ပြောင်းပေးသည်။
၎င်းသည် ကျွန်ုပ်တို့အား ပန်ဒါ DataFrame တစ်ခုဖန်တီးနိုင်စေပြီး ရရှိလာသော DataFrame ရှိ ကော်လံတစ်ခုစီသည် အရှည်တူညီကြောင်း သေချာစေရန် NaN တန်ဖိုးများကို ရိုးရှင်းစွာဖြည့်စွက်ပါ။
အောက်ဖော်ပြပါ ဥပမာသည် ဤ syntax ကို လက်တွေ့တွင် မည်သို့အသုံးပြုရမည်ကို ပြသထားသည်။
ဥပမာ- Pandas DataFrame ကို အရှည်အမျိုးမျိုးဖြင့် dict တစ်ခုမှ ဖန်တီးပါ။
ကျွန်ုပ်တို့တွင် အရှည်အမျိုးမျိုးရှိသော ထည့်သွင်းမှုများပါရှိသော အောက်ပါအဘိဓာန်တွင် ဆိုပါစို့။
#create dictionary whose entries have different lengths some_dict = dict(A=[2, 5, 5, 7, 8], B=[9, 3], C=[4, 4, 2]) #view dictionary print (some_dict) {'A': [2, 5, 5, 7, 8], 'B': [9, 3], 'C': [4, 4, 2]}
ဤအဘိဓာန်ကို pandas DataFrame အဖြစ်သို့ပြောင်းလဲရန် from_dict() လုပ်ဆောင်ချက်ကို အသုံးပြုရန် ကြိုးစားပါက၊ ကျွန်ုပ်တို့သည် အမှားတစ်ခု ရရှိလိမ့်မည်-
import pandas as pd #attempt to create pandas DataFrame from dictionary df = pd. DataFrame . from_dict (some_dict) ValueError : All arrays must be of the same length
အဘိဓာန်ရှိ အခင်းအကျင်းအားလုံးသည် အရှည် တူညီရမည်ဟု ကျွန်ုပ်တို့အား မှားယွင်းစွာ ပြောပြပါသည်။
ဤအမှားကိုဖြေရှင်းရန်၊ ကျွန်ုပ်တို့သည် Dictionary ကို DataFrame သို့ပြောင်းရန် အောက်ပါ syntax ကိုသုံးနိုင်သည်။
import pandas as pd #create pandas DataFrame from dictionary df = pd. DataFrame (dict([(key, pd. Series (value)) for key, value in some_dict. items ()])) #view DataFrame print (df) ABC 0 2 9.0 4.0 1 5 3.0 4.0 2 5 NaN 2.0 3 7 NaN NaN 4 8 NaN NaN
ကျွန်ုပ်တို့သည် pandas DataFrame ကို အောင်မြင်စွာဖန်တီးနိုင်ခဲ့ပြီး ကော်လံတစ်ခုစီသည် အရှည်ဖြစ်ကြောင်းသေချာစေရန် NaN တန်ဖိုးများကို padded လုပ်ထားသည်ကို သတိပြုပါ။
ဤ NaN တန်ဖိုးများကို အခြားတန်ဖိုးများ (ဥပမာ သုည) ဖြင့် အစားထိုးလိုပါက အောက်ပါအတိုင်း replace() လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်ပါသည်။
#replace all NaNs with zeros
df. replace (np. nan , 0, inplace= True )
#view updated DataFrame
print (df)
ABC
0 2 9.0 4.0
1 5 3.0 4.0
2 5 0.0 2.0
3 7 0.0 0.0
4 8 0.0 0.0
NaN တန်ဖိုးတစ်ခုစီကို သုညဖြင့် အစားထိုးထားသည်ကို သတိပြုပါ။
NaN တန်ဖိုးများကို သင်လိုချင်သမျှတန်ဖိုးဖြင့် အစားထိုးရန် replace() လုပ်ဆောင်ချက်ကို လွတ်လပ်စွာ အသုံးပြုပါ။
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ဖော်ပြပါ သင်ခန်းစာများသည် ပန်ဒါများတွင် အခြားဘုံလုပ်ဆောင်ချက်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-
Pandas- DataFrame ကို အဘိဓာန်အဖြစ် ဘယ်လိုပြောင်းမလဲ။
Pandas- ကော်လံများကို အဘိဓာန်ဖြင့် အမည်ပြောင်းနည်း
Pandas- အဘိဓာန်ကို အသုံးပြု၍ NaN တန်ဖိုးများကို ဖြည့်စွက်နည်း