पायथन में पेरेटो चार्ट कैसे बनाएं (चरण दर चरण)


पेरेटो चार्ट एक प्रकार का चार्ट है जो श्रेणियों की क्रमबद्ध आवृत्तियों के साथ-साथ श्रेणियों की संचयी आवृत्तियों को भी प्रदर्शित करता है।

पायथन में पेरेटो चार्ट

यह ट्यूटोरियल पायथन में पेरेटो चार्ट बनाने का चरण-दर-चरण उदाहरण प्रदान करता है।

चरण 1: डेटा बनाएं

मान लीजिए कि हम एक सर्वेक्षण करते हैं जिसमें हम 350 अलग-अलग लोगों से ब्रांड ए, बी, सी, डी और ई के बीच उनके पसंदीदा अनाज ब्रांड की पहचान करने के लिए कहते हैं।

हम सर्वेक्षण परिणामों को रखने के लिए निम्नलिखित पांडा डेटाफ़्रेम बना सकते हैं:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' count ': [97, 140, 58, 6, 17, 32]})
df. index = ['B', 'A', 'C', 'F', 'E', 'D']

#sort DataFrame by count descending
df = df. sort_values (by=' count ', ascending= False )

#add column to display cumulative percentage
df[' cumperc '] = df[' count ']. cumsum ()/df[' count ']. sum ()*100

#view DataFrame
df

	count cumperc
At 140 40.000000
B 97 67.714286
C 58 84.285714
D 32 93.428571
E 17 98.285714
F 6 100.000000

चरण 2: पेरेटो चार्ट बनाएं

पेरेटो चार्ट बनाने के लिए हम निम्नलिखित कोड का उपयोग कर सकते हैं:

 import matplotlib. pyplot as plt
from matplotlib. ticker import PercentFormatter

#define aesthetics for plot
color1 = ' steelblue '
color2 = ' red '
line_size = 4

#create basic bar plot
fig, ax = plt. subplots ()
ax. bar (df. index , df[' count '], color=color1)

#add cumulative percentage line to plot
ax2 = ax. twinx ()
ax2. plot ( df.index , df[' cumperc '], color=color2, marker=" D ", ms=line_size)
ax2. yaxis . set_major_formatter (PercentFormatter())

#specify axis colors
ax. tick_params (axis=' y ', colors=color1)
ax2. tick_params (axis=' y ', colors=color2)

#display Pareto chart
plt. show ()

पायथन में पेरेटो चार्ट

एक्स अक्ष उच्चतम से निम्नतम आवृत्ति तक ऑर्डर किए गए विभिन्न ब्रांडों को प्रदर्शित करता है।

बायां y-अक्ष प्रत्येक ब्रांड की आवृत्ति दिखाता है और दायां y-अक्ष ब्रांडों की संचयी आवृत्ति दिखाता है।

उदाहरण के लिए, हम देख सकते हैं:

  • ब्रांड ए कुल सर्वेक्षण प्रतिक्रियाओं का लगभग 40% प्रतिनिधित्व करता है।
  • ब्रांड ए और बी कुल सर्वेक्षण प्रतिक्रियाओं का लगभग 70% प्रतिनिधित्व करते हैं।
  • ब्रांड ए, बी और सी कुल सर्वेक्षण प्रतिक्रियाओं का लगभग 85% प्रतिनिधित्व करते हैं।

और इसी तरह।

चरण 3: पेरेटो चार्ट को अनुकूलित करें (वैकल्पिक)

पेरेटो चार्ट को अपनी इच्छानुसार दिखाने के लिए आप बार के रंग और संचयी प्रतिशत रेखा का आकार बदल सकते हैं।

उदाहरण के लिए, हम पट्टियों को गुलाबी और रेखा को बैंगनी और थोड़ा मोटा कर सकते हैं:

 import matplotlib. pyplot as plt
from matplotlib. ticker import PercentFormatter

#define aesthetics for plot
color1 = ' pink '
color2 = ' purple '
line_size = 6

#create basic bar plot
fig, ax = plt. subplots ()
ax. bar (df. index , df[' count '], color=color1)

#add cumulative percentage line to plot
ax2 = ax. twinx ()
ax2. plot (df.index , df[' cumperc '], color=color2, marker=" D ", ms=line_size )
ax2. yaxis . set_major_formatter (PercentFormatter())

#specify axis colors
ax. tick_params (axis=' y ', colors=color1)
ax2. tick_params (axis=' y ', colors=color2)

#display Pareto chart
plt. show () 

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि पायथन में अन्य सामान्य विज़ुअलाइज़ेशन कैसे बनाएं:

पायथन में बेल कर्व कैसे बनाएं
पायथन में ऑगिव चार्ट कैसे बनाएं
पायथन में स्टेम और लीफ प्लॉट कैसे बनाएं

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *