पांडा में संचयी प्रतिशत की गणना कैसे करें
आप पांडा डेटाफ़्रेम के एक कॉलम में मानों के संचयी प्रतिशत की गणना करने के लिए निम्नलिखित मूल वाक्यविन्यास का उपयोग कर सकते हैं:
#calculate cumulative sum of column df[' cum_sum '] = df[' col1 ']. cumsum () #calculate cumulative percentage of column (rounded to 2 decimal places) df[' cum_percent '] = round( 100 *df. cum_sum /df[' col1 ']. sum (), 2 )
निम्नलिखित उदाहरण दिखाता है कि व्यवहार में इस वाक्यविन्यास का उपयोग कैसे करें।
उदाहरण: पांडा के बीच संचयी प्रतिशत की गणना करें
मान लीजिए कि हमारे पास निम्नलिखित पांडा डेटाफ़्रेम है जो किसी कंपनी द्वारा लगातार वर्षों में बेची गई इकाइयों की संख्या दिखाता है:
import pandas as pd #createDataFrame df = pd. DataFrame ({' year ': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10], ' units_sold ': [60, 75, 77, 87, 104, 134, 120, 125, 140, 150]}) #view DataFrame print (df) year units_sold 0 1 60 1 2 75 2 3 77 3 4 87 4 5 104 5 6 134 6 7 120 7 8 125 8 9 140 9 10 150
इसके बाद, हम एक कॉलम जोड़ने के लिए निम्नलिखित कोड का उपयोग कर सकते हैं जो बेची गई इकाइयों की संचयी संख्या और बेची गई इकाइयों का संचयी प्रतिशत प्रदर्शित करता है:
#calculate cumulative sum of units sold
df[' cum_sum '] = df[' units_sold ']. cumsum ()
#calculate cumulative percentage of units sold
df[' cum_percent '] = round( 100 *df. cum_sum /df[' units_sold ']. sum (), 2 )
#view updated DataFrame
print (df)
year units_sold cum_sum cum_percent
0 1 60 60 5.60
1 2 75 135 12.59
2 3 77 212 19.78
3 4 87 299 27.89
4 5 104 403 37.59
5 6 134 537 50.09
6 7 120 657 61.29
7 8 125 782 72.95
8 9 140 922 86.01
9 10 150 1072 100.00
हम संचयी प्रतिशत की व्याख्या इस प्रकार करते हैं:
- कुल बिक्री का 5.60% पहले वर्ष में किया गया था।
- कुल बिक्री का 12.59 वर्ष 1 और 2 को मिलाकर बनाया गया।
- कुल बिक्री का 19.78% वर्ष 1, 2 और 3 में संयुक्त रूप से किया गया।
और इसी तरह।
ध्यान दें कि आप प्रदर्शित दशमलव बिंदुओं की संख्या को बदलने के लिए केवल राउंड() फ़ंक्शन में मान बदल सकते हैं।
उदाहरण के लिए, हम इसके बजाय संचयी प्रतिशत को शून्य दशमलव स्थानों तक पूर्णांकित कर सकते हैं:
#calculate cumulative sum of units sold
df[' cum_sum '] = df[' units_sold ']. cumsum ()
#calculate cumulative percentage of units sold
df[' cum_percent '] = round( 100 *df. cum_sum /df[' units_sold ']. sum (), 0 )
#view updated DataFrame
print (df)
year units_sold cum_sum cum_percent
0 1 60 60 6.0
1 2 75 135 13.0
2 3 77 212 20.0
3 4 87 299 28.0
4 5 104 403 38.0
5 6 134 537 50.0
6 7 120 657 61.0
7 8 125 782 73.0
8 9 140 922 86.0
9 10 150 1072 100.0
संचयी प्रतिशत को अब शून्य दशमलव स्थानों तक पूर्णांकित किया गया है।
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल बताते हैं कि पायथन में अन्य सामान्य ऑपरेशन कैसे करें:
पायथन में फ़्रीक्वेंसी टेबल कैसे बनाएं
पायथन में सापेक्ष आवृत्ति की गणना कैसे करें