पांडा: वर्णन() का उपयोग कैसे करें और वैज्ञानिक संकेतन कैसे हटाएं
आप पांडा डेटाफ़्रेम में चर के लिए वर्णनात्मक आँकड़े उत्पन्न करने के लिए वर्णन() फ़ंक्शन का उपयोग कर सकते हैं।
डिस्क्रिप्शन() फ़ंक्शन के आउटपुट से वैज्ञानिक नोटेशन हटाने के लिए, आप निम्न विधियों का उपयोग कर सकते हैं:
विधि 1: किसी कॉलम के साथ विवरण() का उपयोग करते समय वैज्ञानिक संकेतन हटाएँ
df[' my_column ']. describe (). apply ( lambda x: format (x, ' f '))
विधि 2: अनेक स्तंभों के साथ विवरण() का उपयोग करते समय वैज्ञानिक संकेतन हटाएँ
df. describe (). apply ( lambda x: x.apply (' {0:.5f} '. format ))
निम्नलिखित उदाहरण दिखाते हैं कि निम्नलिखित पांडा डेटाफ़्रेम के साथ व्यवहार में प्रत्येक विधि का उपयोग कैसे करें:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' store ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
' sales ': [8450550, 406530, 53000, 6000, 2000, 4000, 5400, 6500],
' returns ':[2212200, 145200, 300, 2500, 700, 600, 800, 1200]})
#view DataFrame
print (df)
store sales returns
0 A 8450550 2212200
1 A 406530 145200
2 A 53000 300
3 A 6000 2500
4 B 2000 700
5 B 4000 600
6 B 5400 800
7 B 6500 1200
उदाहरण 1: किसी कॉलम के साथ डिस्क्रिप्शन() का उपयोग करते समय वैज्ञानिक संकेतन हटाएं
यदि हम बिक्री कॉलम के लिए वर्णनात्मक आंकड़ों की गणना करने के लिए वर्णन() फ़ंक्शन का उपयोग करते हैं, तो आउटपुट मान वैज्ञानिक नोटेशन में प्रदर्शित होंगे:
#calculate descriptive statistics for sales column
df[' sales ']. describe ()
count 8.000000e+00
mean 1.116748e+06
std 2.966552e+06
min 2.000000e+03
25% 5.050000e+03
50% 6.250000e+03
75% 1.413825e+05
max 8.450550e+06
Name: sales, dtype: float64
ध्यान दें कि प्रत्येक आउटपुट मान वैज्ञानिक संकेतन का उपयोग करके प्रदर्शित किया जाता है।
हम आउटपुट से वैज्ञानिक नोटेशन को हटाने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:
#calculate descriptive statistics for sales column and suppress scientific notation
df[' sales ']. describe (). apply ( lambda x: format (x, ' f '))
count 8.000000
mean 1116747.500000
std 2966551.594104
min 2000.000000
25% 5050.000000
50% 6250.000000
75% 141382.500000
max 8450550.000000
Name: sales, dtype: object
ध्यान दें कि आउटपुट में मान अब वैज्ञानिक संकेतन के बिना प्रदर्शित होते हैं।
उदाहरण 2: अनेक स्तंभों के साथ डिस्क्रिप्शन() का उपयोग करते समय वैज्ञानिक संकेतन हटाएँ
यदि हम प्रत्येक संख्यात्मक कॉलम के लिए वर्णनात्मक आंकड़ों की गणना करने के लिए वर्णन() फ़ंक्शन का उपयोग करते हैं, तो आउटपुट मान वैज्ञानिक नोटेशन में प्रदर्शित होंगे:
#calculate descriptive statistics for each numeric column
df. describe ()
sales returns
count 8.000000e+00 8.000000e+00
mean 1.116748e+06 2.954375e+05
std 2.966552e+06 7.761309e+05
min 2.000000e+03 3.000000e+02
25% 5.050000e+03 6.750000e+02
50% 6.250000e+03 1.000000e+03
75% 1.413825e+05 3.817500e+04
max 8.450550e+06 2.212200e+06
ध्यान दें कि प्रत्येक आउटपुट मान वैज्ञानिक संकेतन का उपयोग करके प्रदर्शित किया जाता है।
हम आउटपुट से वैज्ञानिक नोटेशन को हटाने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:
#calculate descriptive statistics for numerical columns and suppress scientific notation
df. describe (). apply ( lambda x: x.apply (' {0:.5f} '. format ))
sales returns
count 8.00000 8.00000
mean 1116747.50000 295437.50000
std 2966551.59410 776130.93692
min 2000.00000 300.00000
25% 5050.00000 675.00000
50% 6250.00000 1000.00000
75% 141382.50000 38175.00000
max 8450550.00000 2212200.00000
ध्यान दें कि आउटपुट में मान अब वैज्ञानिक संकेतन के बिना प्रदर्शित होते हैं।
ध्यान दें कि इस उदाहरण में हमने आउटपुट में 5 दशमलव स्थानों को प्रदर्शित करने के लिए 0:.5f का उपयोग किया है।
दशमलव स्थानों की भिन्न संख्या प्रदर्शित करने के लिए बेझिझक 5 को किसी भिन्न संख्या से बदलें।
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल बताते हैं कि पांडा में अन्य सामान्य ऑपरेशन कैसे करें:
पांडा: प्रति समूह संचयी योग की गणना कैसे करें
पांडा: समूह द्वारा अद्वितीय मूल्यों की गणना कैसे करें
पांडा: समूह द्वारा सहसंबंध की गणना कैसे करें