पांडा: csv फ़ाइल आयात करते समय पहले कॉलम को अनदेखा करें
पांडा डेटाफ़्रेम में CSV फ़ाइल आयात करते समय आप पहले कॉलम को अनदेखा करने के लिए निम्नलिखित मूल सिंटैक्स का उपयोग कर सकते हैं:
with open (' basketball_data.csv ') as x: ncols = len ( x.readline (). split (' , ')) df = pd. read_csv (' basketball_data.csv ', usecols= range (1,ncols))
यह विशेष उदाहरण पहले कॉलम को छोड़कर, बास्केटबॉल_डेटा.सीएसवी नामक सीएसवी फ़ाइल के प्रत्येक कॉलम को पांडा डेटाफ़्रेम में पढ़ेगा।
इस कोड का उपयोग करके, हम पहले CSV फ़ाइल में कॉलम की संख्या ढूंढते हैं और इसे ncols नामक एक वेरिएबल को असाइन करते हैं।
इसके बाद, हम यह निर्दिष्ट करने के लिए यूज़कोल्स तर्क का उपयोग करते हैं कि हम केवल 1 (यानी दूसरा कॉलम) और सीएसवी फ़ाइल के अंतिम कॉलम के बीच के कॉलम को आयात करना चाहते हैं।
निम्नलिखित उदाहरण दिखाता है कि व्यवहार में इस वाक्यविन्यास का उपयोग कैसे करें।
उदाहरण: पांडा में CSV फ़ाइल आयात करते समय पहले कॉलम पर ध्यान न दें
मान लीजिए कि हमारे पास बास्केटबॉल_डेटा.सीएसवी नामक निम्नलिखित सीएसवी फ़ाइल है:
हम CSV फ़ाइल को पांडा डेटाफ़्रेम में आयात करने और पहले कॉलम को अनदेखा करने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:
import pandas as pd #calculate number of columns in CSV file with open (' basketball_data.csv ') as x: ncols = len ( x.readline (). split (' , ')) #import all columns except first column into DataFrame df = pd. read_csv (' basketball_data.csv ', usecols= range (1,ncols)) #view resulting DataFrame print (df) rebound points 0 22 10 1 14 9 2 29 6 3 30 2
ध्यान दें कि जब हमने सीएसवी फ़ाइल को पांडा में आयात किया था तो टीम नामक पहला कॉलम हटा दिया गया था।
ध्यान दें कि यदि आप पहले से ही सीएसवी फ़ाइल में कॉलम की कुल संख्या जानते हैं, तो आप इस मान को सीधे यूज़कोल्स तर्क में प्रदान कर सकते हैं।
उदाहरण के लिए, मान लीजिए कि हम पहले से ही जानते हैं कि सीवीएस फ़ाइल में तीन कॉलम हैं।
हम CSV फ़ाइल को पांडा डेटाफ़्रेम में आयात करने और पहले कॉलम को अनदेखा करने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:
import pandas as pd #import all columns except first column into DataFrame df = pd. read_csv (' basketball_data.csv ', usecols= range (1,3)) #view resulting DataFrame print (df) rebound points 0 22 10 1 14 9 2 29 6 3 30 2
ध्यान दें कि जब हमने सीएसवी फ़ाइल को पांडा में आयात किया था तो टीम नामक पहला कॉलम हटा दिया गया था।
चूँकि हमें पहले से ही पता था कि CSV फ़ाइल में तीन कॉलम हैं, इसलिए हमने यूज़कोल्स तर्क में केवल रेंज (1,3) का उपयोग किया।
नोट : आप पांडा read_csv() फ़ंक्शन का पूरा दस्तावेज़ यहां पा सकते हैं।
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल बताते हैं कि पायथन में अन्य सामान्य कार्य कैसे करें:
पांडा: CSV फ़ाइल पढ़ते समय पंक्तियों को कैसे छोड़ें
पांडा: मौजूदा सीएसवी फ़ाइल में डेटा कैसे जोड़ें
पांडा: यूज़कोल्स तर्क के साथ read_csv का उपयोग कैसे करें