पांडा: एक्सेल फ़ाइल आयात करते समय प्रकार कैसे निर्दिष्ट करें
पांडा में एक्सेल फ़ाइल आयात करते समय आप डेटाफ़्रेम में प्रत्येक कॉलम के प्रकार को निर्दिष्ट करने के लिए निम्नलिखित मूल वाक्यविन्यास का उपयोग कर सकते हैं:
df = pd. read_excel (' my_data.xlsx ', dtype = {' col1 ': str , ' col2 ': float , ' col3 ': int })
Dtype तर्क उस डेटा प्रकार को निर्दिष्ट करता है जो Excel फ़ाइल को पांडा डेटाफ़्रेम में आयात करते समय प्रत्येक कॉलम में होना चाहिए।
निम्नलिखित उदाहरण दिखाता है कि व्यवहार में इस वाक्यविन्यास का उपयोग कैसे करें।
उदाहरण: पांडा में एक्सेल फ़ाइल आयात करते समय प्रकार निर्दिष्ट करें
मान लीजिए कि हमारे पास प्लेयर_डेटा.xlsx नामक निम्नलिखित एक्सेल फ़ाइल है:
यदि हम read_excel() फ़ंक्शन का उपयोग करके एक्सेल फ़ाइल आयात करते हैं, तो पांडा प्रत्येक कॉलम के लिए डेटा प्रकार को स्वचालित रूप से पहचानने का प्रयास करेगा:
import pandas as pd #import Excel file df = pd. read_excel (' player_data.xlsx ') #view resulting DataFrame print (df) team points rebound assists 0 to 24 8 5 1 B 20 12 3 2 C 15 4 7 3 D 19 4 8 4 E 32 6 8 5 F 13 7 9 #view data type of each column print ( df.dtypes ) team object int64 dots rebounds int64 assists int64 dtype:object
परिणाम से, हम देख सकते हैं कि डेटाफ़्रेम के कॉलम में निम्नलिखित डेटा प्रकार हैं:
- टीम :वस्तु
- अंक : int64
- बाउंस : int64
- सहायता : int64
हालाँकि, हम प्रत्येक कॉलम में होने वाले डेटा प्रकारों को निर्दिष्ट करने के लिए read_excel() फ़ंक्शन में dtype तर्क का उपयोग कर सकते हैं:
import pandas as pd #import Excel file and specify dtypes of columns df = pd. read_excel (' player_data.xlsx ', dtype = {' team ': str , ' points ': float , ' rebounds ': int , ' assists ': float }) #view resulting DataFrame print (df) team points rebound assists 0 A 24.0 8 5.0 1 B 20.0 12 3.0 2 C 15.0 4 7.0 3 D 19.0 4 8.0 4 E 32.0 6 8.0 5 F 13.0 7 9.0 #view data type of each column print ( df.dtypes ) team object float64 points rebounds int32 assist float64 dtype:object
परिणाम से, हम देख सकते हैं कि डेटाफ़्रेम के कॉलम में निम्नलिखित डेटा प्रकार हैं:
- टीम :वस्तु
- अंक : फ्लोट64
- बाउंस : int32
- सहायता : फ्लोट64
ये डेटा प्रकार उन डेटा प्रकारों से मेल खाते हैं जिन्हें हमने dtype तर्क का उपयोग करके निर्दिष्ट किया है।
ध्यान दें कि इस उदाहरण में हमने डेटाफ़्रेम में प्रत्येक कॉलम के लिए प्रकार निर्दिष्ट किया है।
हालाँकि, आप केवल विशिष्ट स्तंभों के लिए प्रकार निर्दिष्ट करना चुन सकते हैं और पांडा को शेष स्तंभों के प्रकार का अनुमान लगाने दे सकते हैं।
नोट : आप पांडा read_excel() फ़ंक्शन का पूरा दस्तावेज़ यहां पा सकते हैं।
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल बताते हैं कि पांडा में अन्य सामान्य कार्य कैसे करें:
पांडा: एक्सेल फ़ाइल पढ़ते समय पंक्तियों को कैसे छोड़ें
पांडा: एकाधिक एक्सेल शीट को कैसे संयोजित करें
पांडा: एकाधिक एक्सेल शीट में डेटाफ़्रेम कैसे लिखें