နောက်ပိုင်းအသုံးပြုရန်အတွက် pandas dataframe ကို မည်သို့သိမ်းဆည်းနည်း (ဥပမာနှင့်အတူ)
မကြာခဏဆိုသလို သင်သည် CSV ဖိုင်မှဒေတာကို ပြန်လည်တင်သွင်းစရာမလိုဘဲ နောက်ပိုင်းအသုံးပြုရန်အတွက် ပန်ဒါ DataFrame ကို သိမ်းဆည်းလိုပေမည်။
ဒါကိုလုပ်ဖို့ အလွယ်ဆုံးနည်းလမ်းကတော့ DataFrame ကို pickle ဖိုင်အဖြစ် သိမ်းဆည်းဖို့ to_pickle() ကို သုံးဖို့ပါပဲ။
df. to_pickle (" my_data.pkl ")
၎င်းသည် သင့်လက်ရှိအလုပ်ပတ်ဝန်းကျင်တွင် DataFrame ကို သိမ်းဆည်းမည်ဖြစ်သည်။
ထို့နောက် ကောက်ချက်ဖိုင်မှ DataFrame ကို အမြန်ဖတ်ရန် read_pickle() ကို အသုံးပြုနိုင်သည်။
df = pd. read_pickle (" my_data.pkl ")
အောက်ဖော်ပြပါ ဥပမာသည် ဤလုပ်ဆောင်ချက်များကို လက်တွေ့အသုံးချနည်းကို ပြသထားသည်။
ဥပမာ- Pandas DataFrame ကို သိမ်းဆည်းပြီး တင်ပါ။
အမျိုးမျိုးသောဘတ်စကက်ဘောအသင်းများအကြောင်းအချက်အလက်ပါရှိသောအောက်ပါပန်ဒါ DataFrame ကိုကျွန်ုပ်တို့ဖန်တီးသည်ဆိုပါစို့။
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
' points ': [18, 22, 19, 14, 14, 11, 20, 28],
' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})
#view DataFrame
print (df)
team points assists rebounds
0 A 18 5 11
1 B 22 7 8
2 C 19 7 10
3 D 14 9 6
4 E 14 12 6
5 F 11 9 5
6 G 20 9 9
7:28 4 12
DataFrame အတွင်းရှိ variable တစ်ခုစီ၏ ဒေတာအမျိုးအစားကို ပြသရန် df.info() ကို အသုံးပြုနိုင်ပါသည်။
#view DataFrame info
print ( df.info ())
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 8 entries, 0 to 7
Data columns (total 4 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 team 8 non-null object
1 point 8 non-null int64
2 assists 8 non-null int64
3 rebounds 8 non-null int64
dtypes: int64(3), object(1)
memory usage: 292.0+ bytes
None
ကျွန်ုပ်တို့သည် ဤ DataFrame ကို .pkl တိုးချဲ့မှုတစ်ခုပါရှိသော pickle ဖိုင်တွင်သိမ်းဆည်းရန် to_pickle() လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်ပါသည်။
#save DataFrame to pickle file
df. to_pickle (" my_data.pkl ")
ကျွန်ုပ်တို့၏ DataFrame ကို ယခု ကျွန်ုပ်တို့၏ လက်ရှိလုပ်ငန်းခွင်ပတ်ဝန်းကျင်တွင် အချဉ်သီးဖိုင်အဖြစ် သိမ်းဆည်းထားပါသည်။
ထို့နောက် DataFrame ကို လျင်မြန်စွာဖတ်ရန် read_pickle() လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်သည်။
#read DataFrame from pickle file
df=pd. read_pickle (" my_data.pkl ")
#view DataFrame
print (df)
team points assists rebounds
0 A 18 5 11
1 B 22 7 8
2 C 19 7 10
3 D 14 9 6
4 E 14 12 6
5 F 11 9 5
6 G 20 9 9
7:28 4 12
ကော်လံတစ်ခုစီ၏ ဒေတာအမျိုးအစားသည် ယခင်ကဲ့သို့ပင်ဖြစ်ကြောင်း အတည်ပြုရန် df.info() ကို ထပ်မံအသုံးပြုနိုင်ပါသည်-
#view DataFrame info
print ( df.info ())
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 8 entries, 0 to 7
Data columns (total 4 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 team 8 non-null object
1 point 8 non-null int64
2 assists 8 non-null int64
3 rebounds 8 non-null int64
dtypes: int64(3), object(1)
memory usage: 292.0+ bytes
None
Pickle ဖိုင်များကို အသုံးပြုခြင်း၏ အားသာချက်မှာ DataFrame ကို သိမ်းဆည်းပြီး တင်သည့်အခါ ကော်လံတစ်ခုစီ၏ ဒေတာအမျိုးအစားကို ထိန်းသိမ်းထားခြင်းဖြစ်သည်။
၎င်းသည် DataFrame ၏မူရင်းအခြေအနေကို ထိန်းသိမ်းထားသောကြောင့် ကျွန်ုပ်တို့သည် DataFrame တွင် မည်သည့်အသွင်ပြောင်းမှုမှ လုပ်ဆောင်ရန် မလိုအပ်သောကြောင့် CSV ဖိုင်များကို သိမ်းဆည်းခြင်းနှင့် တင်ခြင်းထက် အားသာချက်ကို ပံ့ပိုးပေးပါသည်။
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ဖော်ပြပါ သင်ခန်းစာများသည် Python ရှိ အခြားသော ဘုံအမှားများကို မည်သို့ပြင်ဆင်ရမည်ကို ရှင်းပြသည်-
Pandas တွင် KeyError ကိုဘယ်လိုပြင်မလဲ။
ပြင်ဆင်နည်း- ValueError- float NaN ကို int အဖြစ်သို့ ပြောင်းလဲ၍မရပါ။
ပြုပြင်နည်း- တန်ဖိုးအမှား- Operands များကို ပုံသဏ္ဍာန်များဖြင့် ထုတ်လွှင့်၍မရပါ။