ပန်ဒါများ- အတန်းတစ်ခုလျှင် ကော်လံအရေအတွက် မတူညီသော csv ကို တင်သွင်းပါ။


အတန်းတစ်ခုစီတွင် ကော်လံအရေအတွက် မတူညီသောအခါတွင် CSV ဖိုင်ကို ပန်ဒါများထဲသို့ တင်သွင်းရန် အောက်ပါအခြေခံ syntax ကို အသုံးပြုနိုင်ပါသည်။

 df = pd. read_csv (' uneven_data.csv ', header= None , names=range( 4 ))

range() လုပ်ဆောင်ချက်အတွင်းရှိ တန်ဖိုးသည် အများဆုံး ကော်လံအရေအတွက်နှင့် အတန်းရှိ ကော်လံအရေအတွက် ဖြစ်သင့်သည်။

အောက်ဖော်ပြပါ ဥပမာသည် ဤ syntax ကို လက်တွေ့တွင် မည်သို့အသုံးပြုရမည်ကို ပြသထားသည်။

ဥပမာ- အတန်းတစ်ခုလျှင် ကော်လံအရေအတွက် မတူညီသော Pandas သို့ CSV ကို ထည့်သွင်းပါ။

ကျွန်ုပ်တို့တွင် uneven_data.csv ဟုခေါ်သော အောက်ပါ CSV ဖိုင်ရှိသည် ဆိုကြပါစို့။

အတန်းတစ်ခုစီတွင် ကော်လံအရေအတွက် တူညီခြင်းမရှိကြောင်း သတိပြုပါ။

ကျွန်ုပ်တို့သည် ဤ CSV ဖိုင်ကို pandas DataFrame သို့တင်သွင်းရန် read_csv() လုပ်ဆောင်ချက်ကို အသုံးပြုပါက၊ ကျွန်ုပ်တို့သည် အမှားတစ်ခုကို လက်ခံရရှိလိမ့်မည်-

 import pandas as pd

#attempt to import CSV file with differing number of columns per row
df = pd. read_csv (' uneven_data.csv ', header= None )

ParserError: Error tokenizing data. C error: Expected 2 fields in line 2, saw 4

ပန်ဒါများသည် အကွက် 2 ကွက်ကို မျှော်လင့်ထားကြောင်း (၎င်းသည် ပထမအတန်းရှိ ကော်လံအရေအတွက်ဖြစ်သောကြောင့်) ကျွန်ုပ်တို့အား ပန်ဒါများက အကြောင်းကြားသည့် ပါဆာအမှား တစ်ခု လက်ခံရရှိသော်လည်း 4 ကို တွေ့ရပါသည်။

ဤအမှားသည် ပေးထားသောအတန်းတစ်ခုရှိ အများဆုံးကော်လံအရေအတွက်သည် 4 ကြောင်းကို ကျွန်ုပ်တို့အားပြောပြသည်။

ထို့ကြောင့်၊ ကျွန်ုပ်တို့သည် CSV ဖိုင်ကို တင်သွင်းနိုင်ပြီး အမည်များဆိုင်ရာ အငြင်းပွားမှုသို့ အပိုင်းအခြား (၄) တန်ဖိုးကို ပေးဆောင်နိုင်သည်-

 import pandas as pd

#import CSV file with differing number of columns per row
df = pd. read_csv (' uneven_data.csv ', header= None , names=range( 4 )))

#view DataFrame
print (df)

   0 1 2 3
0 to 22 NaN NaN
1 B 16 10.0 12.0
2 C 25 10.0 NaN
3 D 14 2.0 7.0
4 E 20 4.0 NaN

ကျွန်ုပ်တို့သည် ကော်လံ 4 ခုကို မျှော်လင့်ရန်ပန်ဒါများကို ပြတ်သားစွာပြောထားသောကြောင့် ကျွန်ုပ်တို့သည် အမှားအယွင်းမရှိဘဲ CSV ဖိုင်ကို pandas DataFrame ထဲသို့ အောင်မြင်စွာတင်သွင်းနိုင်သည်ကို သတိပြုပါ။

ပုံမှန်အားဖြင့်၊ ပန်ဒါများသည် အတန်းတစ်ခုစီရှိ ပျောက်ဆုံးနေသောတန်ဖိုးအားလုံးကို NaN ဖြင့် ဖြည့်ပေးသည်။

ပျောက်ဆုံးနေသောတန်ဖိုးများကို သုညအဖြစ်မြင်လိုပါက၊ အောက်ပါအတိုင်း fillna() လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်ပါသည်။

 #fill NaN values with zeros
df_new = df. fillna ( 0 )

#view new DataFrame
print (df_new)

   0 1 2 3
0 to 22 0.0 0.0
1 B 16 10.0 12.0
2 C 25 10.0 0.0
3 D 14 2.0 7.0
4 E 20 4.0 0.0

DataFrame ရှိ NaN တန်ဖိုးတစ်ခုစီကို သုညဖြင့် အစားထိုးလိုက်ပါပြီ။

မှတ်ချက် – pandas read_csv() လုပ်ဆောင်ချက်၏ စာရွက်စာတမ်းအပြည့်အစုံကို ဤနေရာတွင် ရှာတွေ့နိုင်ပါသည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ပါ သင်ခန်းစာများသည် Python တွင် အခြားသော အသုံးများသော အလုပ်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

ပန်ဒါများ- CSV ဖိုင်ကိုဖတ်သည့်အခါ လိုင်းများကို ကျော်သွားနည်း
Pandas- ရှိပြီးသား CSV ဖိုင်တစ်ခုသို့ ဒေတာထည့်နည်း
Pandas- CSV ဖိုင်ကိုတင်သွင်းသည့်အခါ အမျိုးအစားများကို သတ်မှတ်နည်း
Pandas- CSV ဖိုင်ကိုတင်သွင်းသည့်အခါ ကော်လံအမည်များကို သတ်မှတ်ပါ။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်