पांडा: csv फ़ाइल आयात करते समय प्रकार कैसे निर्दिष्ट करें


पांडा में CSV फ़ाइल आयात करते समय आप डेटाफ़्रेम में प्रत्येक कॉलम के प्रकार को निर्दिष्ट करने के लिए निम्नलिखित मूल सिंटैक्स का उपयोग कर सकते हैं:

 df = pd. read_csv (' my_data.csv ',
                 dtype = {' col1 ': str , ' col2 ': float , ' col3 ': int })

Dtype तर्क उस डेटा प्रकार को निर्दिष्ट करता है जो CSV फ़ाइल को पांडा डेटाफ़्रेम में आयात करते समय प्रत्येक कॉलम में होना चाहिए।

निम्नलिखित उदाहरण दिखाता है कि व्यवहार में इस वाक्यविन्यास का उपयोग कैसे करें।

उदाहरण: पांडा में CSV फ़ाइल आयात करते समय प्रकार निर्दिष्ट करें

मान लीजिए कि हमारे पास बास्केटबॉल_डेटा.सीएसवी नामक निम्नलिखित सीएसवी फ़ाइल है:

यदि हम read_csv() फ़ंक्शन का उपयोग करके CSV फ़ाइल आयात करते हैं, तो पांडा प्रत्येक कॉलम के लिए डेटा प्रकार को स्वचालित रूप से पहचानने का प्रयास करेगा:

 import pandas as pd

#import CSV file
df = pd. read_csv (' basketball_data.csv ')

#view resulting DataFrame
print (df)

   At 22 10
0 B 14 9
1 C 29 6
2 D 30 2
3 E 22 9
4 F 31 10

#view data type of each column
print ( df.dtypes )

team object
int64 dots
rebounds int64
dtype:object

परिणाम से, हम देख सकते हैं कि डेटाफ़्रेम के कॉलम में निम्नलिखित डेटा प्रकार हैं:

  • टीम :वस्तु
  • अंक : int64
  • बाउंस : int64

हालाँकि, हम प्रत्येक कॉलम में होने वाले डेटा प्रकारों को निर्दिष्ट करने के लिए read_csv() फ़ंक्शन में dtype तर्क का उपयोग कर सकते हैं:

import pandas as pd

#import CSV file and specify dtype of each column
df = pd. read_csv (' basketball_data.csv ',
                 dtype = {' team ': str , ' points ': float , ' rebounds ': int }))

#view resulting DataFrame
print (df)

   At 22 10
0 B 14 9
1 C 29 6
2 D 30 2
3 E 22 9
4 F 31 10

#view data type of each column
print ( df.dtypes )

team object
float64 points
rebounds int32
dtype:object

परिणाम से, हम देख सकते हैं कि डेटाफ़्रेम के कॉलम में निम्नलिखित डेटा प्रकार हैं:

  • टीम :वस्तु
  • अंक : फ्लोट64
  • बाउंस : int32

ये डेटा प्रकार उन डेटा प्रकारों से मेल खाते हैं जिन्हें हमने dtype तर्क का उपयोग करके निर्दिष्ट किया है।

ध्यान दें कि इस उदाहरण में हमने डेटाफ़्रेम में प्रत्येक कॉलम के लिए प्रकार निर्दिष्ट किया है।

हालाँकि, आप केवल विशिष्ट स्तंभों के लिए प्रकार निर्दिष्ट करना चुन सकते हैं और पांडा को शेष स्तंभों के प्रकार का अनुमान लगाने दे सकते हैं।

नोट : आप पांडा read_csv() फ़ंक्शन का पूरा दस्तावेज़ यहां पा सकते हैं।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि पांडा में अन्य सामान्य कार्य कैसे करें:

पांडा: CSV फ़ाइल पढ़ते समय पंक्तियों को कैसे छोड़ें
पांडा: मौजूदा सीएसवी फ़ाइल में डेटा कैसे जोड़ें
पांडा: हेडर के बिना सीएसवी फ़ाइल कैसे पढ़ें
पांडा: CSV फ़ाइल आयात करते समय कॉलम नाम कैसे सेट करें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *