अंतिम गाइड: पांडा के साथ सीएसवी फ़ाइलें कैसे पढ़ें
सीएसवी (अल्पविराम से अलग किए गए मान) फ़ाइलें डेटा संग्रहीत करने के सबसे सामान्य तरीकों में से एक हैं।
सौभाग्य से, पांडा read_csv() फ़ंक्शन आपको लगभग किसी भी प्रारूप में पायथन में CSV फ़ाइलों को आसानी से पढ़ने की अनुमति देता है।
यह ट्यूटोरियल “data.csv” नामक निम्नलिखित CSV फ़ाइल का उपयोग करके पायथन में CSV फ़ाइलों को पढ़ने के कई तरीके बताता है:
playerID,team,points 1,Lakers,26 2,Mavs,19 3,Bucks,24 4,Spurs,22
उदाहरण 1: CSV फ़ाइल को पांडा डेटाफ़्रेम में पढ़ें
निम्नलिखित कोड दिखाता है कि CSV फ़ाइल को पांडा डेटाफ़्रेम में कैसे पढ़ा जाए:
#import CSV file as DataFrame df = pd. read_csv ('data.csv') #view DataFrame df playerID team points 0 1 Lakers 26 1 2 Mavs 19 2 3 Bucks 24 3 4 Spurs 22
उदाहरण 2: CSV फ़ाइल से विशिष्ट कॉलम पढ़ें
निम्नलिखित कोड दिखाता है कि CSV फ़ाइल से केवल “प्लेयरआईडी” और “पॉइंट्स” लेबल वाले कॉलम को पांडा डेटाफ़्रेम में कैसे पढ़ा जाए:
#import only specific columns from CSV file df = pd. read_csv ('data.csv', usecols=[' playerID ',' points ']) #view DataFrame df playerID points 0 1 26 1 2 19 2 3 24 3 4 22
आप पांडा डेटाफ़्रेम में पढ़ने के लिए कॉलम इंडेक्स भी निर्दिष्ट कर सकते हैं:
#import only specific columns from CSV file df = pd. read_csv (' data.csv ', usecols=[ 0,1 ]) #view DataFrame df playerID team 0 1 Lakers 1 2 Mavs 2 3 Bucks 3 4 Spurs
उदाहरण 3: CSV फ़ाइल आयात करते समय हेडर पंक्ति निर्दिष्ट करें
कुछ मामलों में, हेडर पंक्ति CSV फ़ाइल में पहली पंक्ति नहीं हो सकती है।
उदाहरण के लिए, निम्नलिखित CSV फ़ाइल पर विचार करें जिसमें हेडर पंक्ति वास्तव में दूसरी पंक्ति में दिखाई देती है:
random,data,values
playerID,team,points
1,Lakers,26
2,Mavs,19
3,Bucks,24
4,Spurs,22
इस CSV फ़ाइल को पांडा डेटाफ़्रेम में पढ़ने के लिए, हम हेडर=1 को निम्नानुसार निर्दिष्ट कर सकते हैं:
#import from CSV file and specify that header starts on second row df = pd. read_csv ('data.csv', header= 1 ) #view DataFrame df playerID team points 0 1 Lakers 26 1 2 Mavs 19 2 3 Bucks 24 3 4 Spurs 22
उदाहरण 4: CSV फ़ाइल आयात करते समय पंक्तियाँ छोड़ें
आप स्किपरो तर्क का उपयोग करके सीएसवी फ़ाइल आयात करते समय पंक्तियों को आसानी से छोड़ भी सकते हैं।
उदाहरण के लिए, निम्नलिखित कोड दिखाता है कि CSV फ़ाइल आयात करते समय दूसरी पंक्ति को कैसे अनदेखा किया जाए:
#import from CSV file and skip second row df = pd. read_csv ('data.csv', skiprows=[ 1 ] ) #view DataFrame df playerID team points 0 2 Mavs 19 1 3 Bucks 24 2 4 Spurs 22
और निम्नलिखित कोड दिखाता है कि CSV फ़ाइल आयात करते समय दूसरी और तीसरी पंक्तियों को कैसे अनदेखा करें:
#import from CSV file and skip second and third rows df = pd. read_csv ('data.csv', skiprows=[ 1,2 ] ) #view DataFrame df playerID team points 1 3 Bucks 24 2 4 Spurs 22
उदाहरण 5: कस्टम डिलीमीटर के साथ सीएसवी फ़ाइलें पढ़ें
कभी-कभी आपके पास अल्पविराम के अलावा किसी अन्य सीमांकक वाली CSV फ़ाइल हो सकती है।
उदाहरण के लिए, मान लीजिए कि हमारी CSV फ़ाइल में सीमांकक के रूप में एक अंडरस्कोर है:
playerID_team_points
1_Lakers_26
2_Mavs_19
3_Bucks_24
4_Spurs_22
इस CSV फ़ाइल को पांडा में पढ़ने के लिए, हम फ़ाइल को पढ़ते समय उपयोग किए जाने वाले सीमांकक को निर्दिष्ट करने के लिए sep तर्क का उपयोग कर सकते हैं:
#import from CSV file and specify delimiter to use df = pd. read_csv ('data.csv', sep=' _ ') #view DataFrame df playerID team points 0 1 Lakers 26 1 2 Mavs 19 2 3 Bucks 24 3 4 Spurs 22
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल बताते हैं कि अन्य सामान्य पांडा कार्य कैसे करें:
पंडों के साथ टेक्स्ट फ़ाइल कैसे पढ़ें
पंडों के साथ एक्सेल फ़ाइलें कैसे पढ़ें
पंडों के साथ टीएसवी फ़ाइलें कैसे पढ़ें
पांडा के साथ HTML तालिकाएँ कैसे पढ़ें