अंतिम गाइड: पांडा के साथ सीएसवी फ़ाइलें कैसे पढ़ें


सीएसवी (अल्पविराम से अलग किए गए मान) फ़ाइलें डेटा संग्रहीत करने के सबसे सामान्य तरीकों में से एक हैं।

सौभाग्य से, पांडा read_csv() फ़ंक्शन आपको लगभग किसी भी प्रारूप में पायथन में CSV फ़ाइलों को आसानी से पढ़ने की अनुमति देता है।

यह ट्यूटोरियल “data.csv” नामक निम्नलिखित CSV फ़ाइल का उपयोग करके पायथन में CSV फ़ाइलों को पढ़ने के कई तरीके बताता है:

 playerID,team,points
1,Lakers,26
2,Mavs,19
3,Bucks,24
4,Spurs,22

उदाहरण 1: CSV फ़ाइल को पांडा डेटाफ़्रेम में पढ़ें

निम्नलिखित कोड दिखाता है कि CSV फ़ाइल को पांडा डेटाफ़्रेम में कैसे पढ़ा जाए:

 #import CSV file as DataFrame
df = pd. read_csv ('data.csv')

#view DataFrame
df

        playerID team points
0 1 Lakers 26
1 2 Mavs 19
2 3 Bucks 24
3 4 Spurs 22

उदाहरण 2: CSV फ़ाइल से विशिष्ट कॉलम पढ़ें

निम्नलिखित कोड दिखाता है कि CSV फ़ाइल से केवल “प्लेयरआईडी” और “पॉइंट्स” लेबल वाले कॉलम को पांडा डेटाफ़्रेम में कैसे पढ़ा जाए:

 #import only specific columns from CSV file
df = pd. read_csv ('data.csv', usecols=[' playerID ',' points '])

#view DataFrame
df

	playerID points
0 1 26
1 2 19
2 3 24
3 4 22

आप पांडा डेटाफ़्रेम में पढ़ने के लिए कॉलम इंडेक्स भी निर्दिष्ट कर सकते हैं:

 #import only specific columns from CSV file
df = pd. read_csv (' data.csv ', usecols=[ 0,1 ])

#view DataFrame
df

        playerID team
0 1 Lakers
1 2 Mavs
2 3 Bucks
3 4 Spurs

उदाहरण 3: CSV फ़ाइल आयात करते समय हेडर पंक्ति निर्दिष्ट करें

कुछ मामलों में, हेडर पंक्ति CSV फ़ाइल में पहली पंक्ति नहीं हो सकती है।

उदाहरण के लिए, निम्नलिखित CSV फ़ाइल पर विचार करें जिसमें हेडर पंक्ति वास्तव में दूसरी पंक्ति में दिखाई देती है:

 random,data,values
playerID,team,points
1,Lakers,26
2,Mavs,19
3,Bucks,24
4,Spurs,22

इस CSV फ़ाइल को पांडा डेटाफ़्रेम में पढ़ने के लिए, हम हेडर=1 को निम्नानुसार निर्दिष्ट कर सकते हैं:

 #import from CSV file and specify that header starts on second row
df = pd. read_csv ('data.csv', header= 1 )

#view DataFrame
df

        playerID team points
0 1 Lakers 26
1 2 Mavs 19
2 3 Bucks 24
3 4 Spurs 22

उदाहरण 4: CSV फ़ाइल आयात करते समय पंक्तियाँ छोड़ें

आप स्किपरो तर्क का उपयोग करके सीएसवी फ़ाइल आयात करते समय पंक्तियों को आसानी से छोड़ भी सकते हैं।

उदाहरण के लिए, निम्नलिखित कोड दिखाता है कि CSV फ़ाइल आयात करते समय दूसरी पंक्ति को कैसे अनदेखा किया जाए:

 #import from CSV file and skip second row
df = pd. read_csv ('data.csv', skiprows=[ 1 ] )

#view DataFrame
df

        playerID team points
0 2 Mavs 19
1 3 Bucks 24
2 4 Spurs 22

और निम्नलिखित कोड दिखाता है कि CSV फ़ाइल आयात करते समय दूसरी और तीसरी पंक्तियों को कैसे अनदेखा करें:

 #import from CSV file and skip second and third rows
df = pd. read_csv ('data.csv', skiprows=[ 1,2 ] )

#view DataFrame
df

        playerID team points
1 3 Bucks 24
2 4 Spurs 22

उदाहरण 5: कस्टम डिलीमीटर के साथ सीएसवी फ़ाइलें पढ़ें

कभी-कभी आपके पास अल्पविराम के अलावा किसी अन्य सीमांकक वाली CSV फ़ाइल हो सकती है।

उदाहरण के लिए, मान लीजिए कि हमारी CSV फ़ाइल में सीमांकक के रूप में एक अंडरस्कोर है:

 playerID_team_points
1_Lakers_26
2_Mavs_19
3_Bucks_24
4_Spurs_22

इस CSV फ़ाइल को पांडा में पढ़ने के लिए, हम फ़ाइल को पढ़ते समय उपयोग किए जाने वाले सीमांकक को निर्दिष्ट करने के लिए sep तर्क का उपयोग कर सकते हैं:

 #import from CSV file and specify delimiter to use
df = pd. read_csv ('data.csv', sep=' _ ')

#view DataFrame
df

	playerID team points
0 1 Lakers 26
1 2 Mavs 19
2 3 Bucks 24
3 4 Spurs 22

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि अन्य सामान्य पांडा कार्य कैसे करें:

पंडों के साथ टेक्स्ट फ़ाइल कैसे पढ़ें
पंडों के साथ एक्सेल फ़ाइलें कैसे पढ़ें
पंडों के साथ टीएसवी फ़ाइलें कैसे पढ़ें
पांडा के साथ HTML तालिकाएँ कैसे पढ़ें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *