पांडा: एक्सेल फ़ाइल आयात करते समय प्रकार कैसे निर्दिष्ट करें


पांडा में एक्सेल फ़ाइल आयात करते समय आप डेटाफ़्रेम में प्रत्येक कॉलम के प्रकार को निर्दिष्ट करने के लिए निम्नलिखित मूल वाक्यविन्यास का उपयोग कर सकते हैं:

 df = pd. read_excel (' my_data.xlsx ',
                 dtype = {' col1 ': str , ' col2 ': float , ' col3 ': int })

Dtype तर्क उस डेटा प्रकार को निर्दिष्ट करता है जो Excel फ़ाइल को पांडा डेटाफ़्रेम में आयात करते समय प्रत्येक कॉलम में होना चाहिए।

निम्नलिखित उदाहरण दिखाता है कि व्यवहार में इस वाक्यविन्यास का उपयोग कैसे करें।

उदाहरण: पांडा में एक्सेल फ़ाइल आयात करते समय प्रकार निर्दिष्ट करें

मान लीजिए कि हमारे पास प्लेयर_डेटा.xlsx नामक निम्नलिखित एक्सेल फ़ाइल है:

यदि हम read_excel() फ़ंक्शन का उपयोग करके एक्सेल फ़ाइल आयात करते हैं, तो पांडा प्रत्येक कॉलम के लिए डेटा प्रकार को स्वचालित रूप से पहचानने का प्रयास करेगा:

 import pandas as pd

#import Excel file
df = pd. read_excel (' player_data.xlsx ')

#view resulting DataFrame
print (df)

  team points rebound assists
0 to 24 8 5
1 B 20 12 3
2 C 15 4 7
3 D 19 4 8
4 E 32 6 8
5 F 13 7 9

#view data type of each column
print ( df.dtypes )

team object
int64 dots
rebounds int64
assists int64
dtype:object

परिणाम से, हम देख सकते हैं कि डेटाफ़्रेम के कॉलम में निम्नलिखित डेटा प्रकार हैं:

  • टीम :वस्तु
  • अंक : int64
  • बाउंस : int64
  • सहायता : int64

हालाँकि, हम प्रत्येक कॉलम में होने वाले डेटा प्रकारों को निर्दिष्ट करने के लिए read_excel() फ़ंक्शन में dtype तर्क का उपयोग कर सकते हैं:

import pandas as pd

#import Excel file and specify dtypes of columns
df = pd. read_excel (' player_data.xlsx ',
                   dtype = {' team ': str , ' points ': float , ' rebounds ': int ,
                            ' assists ': float })

#view resulting DataFrame
print (df)

  team points rebound assists
0 A 24.0 8 5.0
1 B 20.0 12 3.0
2 C 15.0 4 7.0
3 D 19.0 4 8.0
4 E 32.0 6 8.0
5 F 13.0 7 9.0

#view data type of each column
print ( df.dtypes )

team object
float64 points
rebounds int32
assist float64
dtype:object

परिणाम से, हम देख सकते हैं कि डेटाफ़्रेम के कॉलम में निम्नलिखित डेटा प्रकार हैं:

  • टीम :वस्तु
  • अंक : फ्लोट64
  • बाउंस : int32
  • सहायता : फ्लोट64

ये डेटा प्रकार उन डेटा प्रकारों से मेल खाते हैं जिन्हें हमने dtype तर्क का उपयोग करके निर्दिष्ट किया है।

ध्यान दें कि इस उदाहरण में हमने डेटाफ़्रेम में प्रत्येक कॉलम के लिए प्रकार निर्दिष्ट किया है।

हालाँकि, आप केवल विशिष्ट स्तंभों के लिए प्रकार निर्दिष्ट करना चुन सकते हैं और पांडा को शेष स्तंभों के प्रकार का अनुमान लगाने दे सकते हैं।

नोट : आप पांडा read_excel() फ़ंक्शन का पूरा दस्तावेज़ यहां पा सकते हैं।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि पांडा में अन्य सामान्य कार्य कैसे करें:

पांडा: एक्सेल फ़ाइल पढ़ते समय पंक्तियों को कैसे छोड़ें
पांडा: एकाधिक एक्सेल शीट को कैसे संयोजित करें
पांडा: एकाधिक एक्सेल शीट में डेटाफ़्रेम कैसे लिखें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *