पायथन में पेरेटो चार्ट कैसे बनाएं (चरण दर चरण)
पेरेटो चार्ट एक प्रकार का चार्ट है जो श्रेणियों की क्रमबद्ध आवृत्तियों के साथ-साथ श्रेणियों की संचयी आवृत्तियों को भी प्रदर्शित करता है।
यह ट्यूटोरियल पायथन में पेरेटो चार्ट बनाने का चरण-दर-चरण उदाहरण प्रदान करता है।
चरण 1: डेटा बनाएं
मान लीजिए कि हम एक सर्वेक्षण करते हैं जिसमें हम 350 अलग-अलग लोगों से ब्रांड ए, बी, सी, डी और ई के बीच उनके पसंदीदा अनाज ब्रांड की पहचान करने के लिए कहते हैं।
हम सर्वेक्षण परिणामों को रखने के लिए निम्नलिखित पांडा डेटाफ़्रेम बना सकते हैं:
import pandas as pd #createDataFrame df = pd. DataFrame ({' count ': [97, 140, 58, 6, 17, 32]}) df. index = ['B', 'A', 'C', 'F', 'E', 'D'] #sort DataFrame by count descending df = df. sort_values (by=' count ', ascending= False ) #add column to display cumulative percentage df[' cumperc '] = df[' count ']. cumsum ()/df[' count ']. sum ()*100 #view DataFrame df count cumperc At 140 40.000000 B 97 67.714286 C 58 84.285714 D 32 93.428571 E 17 98.285714 F 6 100.000000
चरण 2: पेरेटो चार्ट बनाएं
पेरेटो चार्ट बनाने के लिए हम निम्नलिखित कोड का उपयोग कर सकते हैं:
import matplotlib. pyplot as plt
from matplotlib. ticker import PercentFormatter
#define aesthetics for plot
color1 = ' steelblue '
color2 = ' red '
line_size = 4
#create basic bar plot
fig, ax = plt. subplots ()
ax. bar (df. index , df[' count '], color=color1)
#add cumulative percentage line to plot
ax2 = ax. twinx ()
ax2. plot ( df.index , df[' cumperc '], color=color2, marker=" D ", ms=line_size)
ax2. yaxis . set_major_formatter (PercentFormatter())
#specify axis colors
ax. tick_params (axis=' y ', colors=color1)
ax2. tick_params (axis=' y ', colors=color2)
#display Pareto chart
plt. show ()
एक्स अक्ष उच्चतम से निम्नतम आवृत्ति तक ऑर्डर किए गए विभिन्न ब्रांडों को प्रदर्शित करता है।
बायां y-अक्ष प्रत्येक ब्रांड की आवृत्ति दिखाता है और दायां y-अक्ष ब्रांडों की संचयी आवृत्ति दिखाता है।
उदाहरण के लिए, हम देख सकते हैं:
- ब्रांड ए कुल सर्वेक्षण प्रतिक्रियाओं का लगभग 40% प्रतिनिधित्व करता है।
- ब्रांड ए और बी कुल सर्वेक्षण प्रतिक्रियाओं का लगभग 70% प्रतिनिधित्व करते हैं।
- ब्रांड ए, बी और सी कुल सर्वेक्षण प्रतिक्रियाओं का लगभग 85% प्रतिनिधित्व करते हैं।
और इसी तरह।
चरण 3: पेरेटो चार्ट को अनुकूलित करें (वैकल्पिक)
पेरेटो चार्ट को अपनी इच्छानुसार दिखाने के लिए आप बार के रंग और संचयी प्रतिशत रेखा का आकार बदल सकते हैं।
उदाहरण के लिए, हम पट्टियों को गुलाबी और रेखा को बैंगनी और थोड़ा मोटा कर सकते हैं:
import matplotlib. pyplot as plt
from matplotlib. ticker import PercentFormatter
#define aesthetics for plot
color1 = ' pink '
color2 = ' purple '
line_size = 6
#create basic bar plot
fig, ax = plt. subplots ()
ax. bar (df. index , df[' count '], color=color1)
#add cumulative percentage line to plot
ax2 = ax. twinx ()
ax2. plot (df.index , df[' cumperc '], color=color2, marker=" D ", ms=line_size )
ax2. yaxis . set_major_formatter (PercentFormatter())
#specify axis colors
ax. tick_params (axis=' y ', colors=color1)
ax2. tick_params (axis=' y ', colors=color2)
#display Pareto chart
plt. show ()
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल बताते हैं कि पायथन में अन्य सामान्य विज़ुअलाइज़ेशन कैसे बनाएं:
पायथन में बेल कर्व कैसे बनाएं
पायथन में ऑगिव चार्ट कैसे बनाएं
पायथन में स्टेम और लीफ प्लॉट कैसे बनाएं