နောက်ပိုင်းအသုံးပြုရန်အတွက် pandas dataframe ကို မည်သို့သိမ်းဆည်းနည်း (ဥပမာနှင့်အတူ)

အားဖြင့် Benjamin Anderson ဇူလိုင် 18, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

မကြာခဏဆိုသလို သင်သည် CSV ဖိုင်မှဒေတာကို ပြန်လည်တင်သွင်းစရာမလိုဘဲ နောက်ပိုင်းအသုံးပြုရန်အတွက် ပန်ဒါ DataFrame ကို သိမ်းဆည်းလိုပေမည်။

ဒါကိုလုပ်ဖို့ အလွယ်ဆုံးနည်းလမ်းကတော့ DataFrame ကို pickle ဖိုင်အဖြစ် သိမ်းဆည်းဖို့ to_pickle() ကို သုံးဖို့ပါပဲ။

 df. to_pickle (" my_data.pkl ")

၎င်းသည် သင့်လက်ရှိအလုပ်ပတ်ဝန်းကျင်တွင် DataFrame ကို သိမ်းဆည်းမည်ဖြစ်သည်။

ထို့နောက် ကောက်ချက်ဖိုင်မှ DataFrame ကို အမြန်ဖတ်ရန် read_pickle() ကို အသုံးပြုနိုင်သည်။

 df = pd. read_pickle (" my_data.pkl ")

အောက်ဖော်ပြပါ ဥပမာသည် ဤလုပ်ဆောင်ချက်များကို လက်တွေ့အသုံးချနည်းကို ပြသထားသည်။

ဥပမာ- Pandas DataFrame ကို သိမ်းဆည်းပြီး တင်ပါ။

အမျိုးမျိုးသောဘတ်စကက်ဘောအသင်းများအကြောင်းအချက်အလက်ပါရှိသောအောက်ပါပန်ဒါ DataFrame ကိုကျွန်ုပ်တို့ဖန်တီးသည်ဆိုပါစို့။

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
print (df)

  team points assists rebounds
0 A 18 5 11
1 B 22 7 8
2 C 19 7 10
3 D 14 9 6
4 E 14 12 6
5 F 11 9 5
6 G 20 9 9
7:28 4 12

DataFrame အတွင်းရှိ variable တစ်ခုစီ၏ ဒေတာအမျိုးအစားကို ပြသရန် df.info() ကို အသုံးပြုနိုင်ပါသည်။

 #view DataFrame info
print ( df.info ())

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 8 entries, 0 to 7
Data columns (total 4 columns):
 # Column Non-Null Count Dtype 
--- ------ -------------- ----- 
 0 team 8 non-null object
 1 point 8 non-null int64 
 2 assists 8 non-null int64 
 3 rebounds 8 non-null int64 
dtypes: int64(3), object(1)
memory usage: 292.0+ bytes
None

ကျွန်ုပ်တို့သည် ဤ DataFrame ကို .pkl တိုးချဲ့မှုတစ်ခုပါရှိသော pickle ဖိုင်တွင်သိမ်းဆည်းရန် to_pickle() လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်ပါသည်။

 #save DataFrame to pickle file
df. to_pickle (" my_data.pkl ")

ကျွန်ုပ်တို့၏ DataFrame ကို ယခု ကျွန်ုပ်တို့၏ လက်ရှိလုပ်ငန်းခွင်ပတ်ဝန်းကျင်တွင် အချဉ်သီးဖိုင်အဖြစ် သိမ်းဆည်းထားပါသည်။

ထို့နောက် DataFrame ကို လျင်မြန်စွာဖတ်ရန် read_pickle() လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်သည်။

 #read DataFrame from pickle file
df=pd. read_pickle (" my_data.pkl ")

#view DataFrame
print (df)

team points assists rebounds
0 A 18 5 11
1 B 22 7 8
2 C 19 7 10
3 D 14 9 6
4 E 14 12 6
5 F 11 9 5
6 G 20 9 9
7:28 4 12

ကော်လံတစ်ခုစီ၏ ဒေတာအမျိုးအစားသည် ယခင်ကဲ့သို့ပင်ဖြစ်ကြောင်း အတည်ပြုရန် df.info() ကို ထပ်မံအသုံးပြုနိုင်ပါသည်-

 #view DataFrame info
print ( df.info ())

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 8 entries, 0 to 7
Data columns (total 4 columns):
 # Column Non-Null Count Dtype 
--- ------ -------------- ----- 
 0 team 8 non-null object
 1 point 8 non-null int64 
 2 assists 8 non-null int64 
 3 rebounds 8 non-null int64 
dtypes: int64(3), object(1)
memory usage: 292.0+ bytes
None

Pickle ဖိုင်များကို အသုံးပြုခြင်း၏ အားသာချက်မှာ DataFrame ကို သိမ်းဆည်းပြီး တင်သည့်အခါ ကော်လံတစ်ခုစီ၏ ဒေတာအမျိုးအစားကို ထိန်းသိမ်းထားခြင်းဖြစ်သည်။

၎င်းသည် DataFrame ၏မူရင်းအခြေအနေကို ထိန်းသိမ်းထားသောကြောင့် ကျွန်ုပ်တို့သည် DataFrame တွင် မည်သည့်အသွင်ပြောင်းမှုမှ လုပ်ဆောင်ရန် မလိုအပ်သောကြောင့် CSV ဖိုင်များကို သိမ်းဆည်းခြင်းနှင့် တင်ခြင်းထက် အားသာချက်ကို ပံ့ပိုးပေးပါသည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် Python ရှိ အခြားသော ဘုံအမှားများကို မည်သို့ပြင်ဆင်ရမည်ကို ရှင်းပြသည်-

Pandas တွင် KeyError ကိုဘယ်လိုပြင်မလဲ။
ပြင်ဆင်နည်း- ValueError- float NaN ကို int အဖြစ်သို့ ပြောင်းလဲ၍မရပါ။
ပြုပြင်နည်း- တန်ဖိုးအမှား- Operands များကို ပုံသဏ္ဍာန်များဖြင့် ထုတ်လွှင့်၍မရပါ။

စာရေးသူအကြောင်း

Benjamin Anderson

မင်္ဂလာပါ၊ ကျွန်ုပ်သည် အငြိမ်းစား စာရင်းအင်း ပါမောက္ခ ဘင်ဂျမင်ဖြစ်ပြီး သီးသန့် Statorials ဆရာအဖြစ် လှည့်ပတ်ပါသည်။ စာရင်းဇယားနယ်ပယ်တွင် ကျယ်ပြန့်သောအတွေ့အကြုံနှင့် ကျွမ်းကျင်မှုနှင့်အတူ၊ Statorials မှတစ်ဆင့် ကျောင်းသားများကို ခွန်အားဖြစ်စေရန်အတွက် ကျွန်ုပ်၏အသိပညာကို မျှဝေလိုပါသည်။ ပိုသိတယ်။

ဥပမာ- Pandas DataFrame ကို သိမ်းဆည်းပြီး တင်ပါ။

ထပ်လောင်းအရင်းအမြစ်များ

စာရေးသူအကြောင်း

Benjamin Anderson

မှတ်ချက်တစ်ခုထည့်ပါ။