एक्सेल में खोजपूर्ण डेटा विश्लेषण कैसे करें


किसी भी डेटा विश्लेषण परियोजना में पहला कदम खोजपूर्ण डेटा विश्लेषण है।

इसमें तीन तरीकों से डेटासेट की खोज करना शामिल है:

1. वर्णनात्मक आँकड़ों का उपयोग करके डेटा के एक सेट को सारांशित करें

2. ग्राफ़ का उपयोग करके डेटा के एक सेट की कल्पना करें

3. लुप्त मानों को पहचानें

इन तीन क्रियाओं को निष्पादित करके, आप समझ सकते हैं कि डेटा सेट में मान कैसे वितरित किए जाते हैं और परिकल्पना परीक्षण के साथ आगे बढ़ने, प्रतिगमन मॉडल फिट करने या सांख्यिकीय मॉडलिंग करने से पहले किसी भी समस्याग्रस्त मान का पता लगा सकते हैं।

निम्नलिखित चरण-दर-चरण उदाहरण दिखाता है कि एक्सेल में खोजपूर्ण डेटा विश्लेषण कैसे करें।

चरण 1: डेटासेट बनाएं

सबसे पहले, आइए एक सरल डेटासेट बनाएं जिसमें 10 अलग-अलग बास्केटबॉल खिलाड़ियों के बारे में जानकारी हो:

इस डेटासेट में तीन वैरिएबल (पॉइंट, रिबाउंड, असिस्ट) होते हैं और कुछ वैरिएबल में खाली या NA मान होते हैं, जो वास्तविक दुनिया के डेटासेट में आम है।

चरण 2: डेटा को सारांशित करें

इसके बाद, हम इस डेटासेट में तीन चरों में से प्रत्येक के लिए माध्य, माध्य, चतुर्थक, न्यूनतम और अधिकतम मान की गणना कर सकते हैं:

यहां वह सूत्र है जिसका उपयोग हमने कॉलम बी में प्रत्येक सेल के लिए किया है:

  • बी13 : =औसत( बी2:बी11 )
  • बी14 : =माध्यिका( बी2:बी11 )
  • बी15 : =चतुर्थक( बी2:बी11 , 1)
  • बी16 : =चतुर्थक( बी2:बी11 , 3)
  • बी17 : =न्यूनतम( बी2:बी11 )
  • बी18 : =मैक्स( बी2:बी11 )

फिर हमने प्रत्येक सूत्र को दाईं ओर खींचा ताकि हम कॉलम सी और डी में मानों के लिए समान मीट्रिक की गणना कर सकें।

प्रत्येक चर के लिए इन वर्णनात्मक आँकड़ों की गणना करके, हम प्रत्येक चर के लिए मूल्यों के वितरण की अच्छी समझ प्राप्त कर सकते हैं।

ध्यान दें : प्रत्येक वर्णनात्मक आँकड़े की गणना करते समय प्रत्येक सूत्र स्वचालित रूप से रिक्त या NA मानों को अनदेखा कर देता है।

चरण 3: डेटा को विज़ुअलाइज़ करें

हम डेटासेट के मूल्यों की कल्पना करने के लिए ग्राफ़ भी बना सकते हैं।

उदाहरण के लिए, पॉइंट वेरिएबल के लिए मानों के वितरण की कल्पना करने के लिए, हम सेल श्रेणी B2:B11 में मानों को हाइलाइट कर सकते हैं, फिर शीर्ष रिबन के साथ सम्मिलित करें टैब पर क्लिक करें, फिर ग्राफ़िक्स समूह में हिस्टोग्राम आइकन पर क्लिक करें :

निम्नलिखित हिस्टोग्राम स्वचालित रूप से बनाया जाएगा:

यह हिस्टोग्राम आपको खिलाड़ियों द्वारा बनाए गए अंकों के वितरण की कल्पना करने की अनुमति देता है।

उदाहरण के लिए, हम देख सकते हैं:

  • 4 खिलाड़ियों ने 10 से 15 अंक के बीच स्कोर किया।
  • 1 खिलाड़ी ने 15 से 20 अंक के बीच स्कोर किया।
  • 2 खिलाड़ियों ने 20 से 25 अंक के बीच स्कोर किया।
  • 3 खिलाड़ियों ने 25 से 30 अंक के बीच स्कोर किया।

हम प्रत्येक चर के लिए मानों के वितरण की कल्पना करने के लिए अपने डेटासेट में प्रत्येक चर के लिए इस प्रक्रिया को दोहरा सकते हैं।

चरण 4: लुप्त मानों की पहचान करें

हम कॉलम बी में लुप्त मानों की संख्या गिनने के लिए निम्नलिखित सूत्र का भी उपयोग कर सकते हैं:

 =SUMPRODUCT(--NOT(ISNUMBER( B2:B11 )))

हम इस सूत्र को सेल B19 में टाइप कर सकते हैं, फिर डेटासेट में प्रत्येक चर के लिए लुप्त मानों की संख्या की गणना करने के लिए इसे दाईं ओर खींचें:

परिणाम से हम देख सकते हैं:

  • पॉइंट कॉलम में 0 लुप्त मान हैं।
  • रिबाउंड्स कॉलम में 2 लुप्त मान हैं।
  • मदद कॉलम में 1 लुप्त मान है।

हमने अब इस डेटासेट पर कुछ बुनियादी खोजपूर्ण डेटा विश्लेषण पूरा कर लिया है और इस डेटासेट में प्रत्येक चर के लिए मान कैसे वितरित किए जाते हैं, इसकी काफी अच्छी समझ प्राप्त कर ली है।

संबंधित: एक्सेल में ब्लैंक सेल्स को जीरो से कैसे बदलें

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि एक्सेल में अन्य सामान्य कार्य कैसे करें:

एक्सेल में पांच नंबरों के सारांश की गणना कैसे करें
एक्सेल में समूह द्वारा औसत की गणना कैसे करें
एक्सेल में प्रति समूह अधिकतम मूल्य की गणना कैसे करें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *