एक्सेल में खोजपूर्ण डेटा विश्लेषण कैसे करें
किसी भी डेटा विश्लेषण परियोजना में पहला कदम खोजपूर्ण डेटा विश्लेषण है।
इसमें तीन तरीकों से डेटासेट की खोज करना शामिल है:
1. वर्णनात्मक आँकड़ों का उपयोग करके डेटा के एक सेट को सारांशित करें ।
2. ग्राफ़ का उपयोग करके डेटा के एक सेट की कल्पना करें ।
3. लुप्त मानों को पहचानें ।
इन तीन क्रियाओं को निष्पादित करके, आप समझ सकते हैं कि डेटा सेट में मान कैसे वितरित किए जाते हैं और परिकल्पना परीक्षण के साथ आगे बढ़ने, प्रतिगमन मॉडल फिट करने या सांख्यिकीय मॉडलिंग करने से पहले किसी भी समस्याग्रस्त मान का पता लगा सकते हैं।
निम्नलिखित चरण-दर-चरण उदाहरण दिखाता है कि एक्सेल में खोजपूर्ण डेटा विश्लेषण कैसे करें।
चरण 1: डेटासेट बनाएं
सबसे पहले, आइए एक सरल डेटासेट बनाएं जिसमें 10 अलग-अलग बास्केटबॉल खिलाड़ियों के बारे में जानकारी हो:
इस डेटासेट में तीन वैरिएबल (पॉइंट, रिबाउंड, असिस्ट) होते हैं और कुछ वैरिएबल में खाली या NA मान होते हैं, जो वास्तविक दुनिया के डेटासेट में आम है।
चरण 2: डेटा को सारांशित करें
इसके बाद, हम इस डेटासेट में तीन चरों में से प्रत्येक के लिए माध्य, माध्य, चतुर्थक, न्यूनतम और अधिकतम मान की गणना कर सकते हैं:
यहां वह सूत्र है जिसका उपयोग हमने कॉलम बी में प्रत्येक सेल के लिए किया है:
- बी13 : =औसत( बी2:बी11 )
- बी14 : =माध्यिका( बी2:बी11 )
- बी15 : =चतुर्थक( बी2:बी11 , 1)
- बी16 : =चतुर्थक( बी2:बी11 , 3)
- बी17 : =न्यूनतम( बी2:बी11 )
- बी18 : =मैक्स( बी2:बी11 )
फिर हमने प्रत्येक सूत्र को दाईं ओर खींचा ताकि हम कॉलम सी और डी में मानों के लिए समान मीट्रिक की गणना कर सकें।
प्रत्येक चर के लिए इन वर्णनात्मक आँकड़ों की गणना करके, हम प्रत्येक चर के लिए मूल्यों के वितरण की अच्छी समझ प्राप्त कर सकते हैं।
ध्यान दें : प्रत्येक वर्णनात्मक आँकड़े की गणना करते समय प्रत्येक सूत्र स्वचालित रूप से रिक्त या NA मानों को अनदेखा कर देता है।
चरण 3: डेटा को विज़ुअलाइज़ करें
हम डेटासेट के मूल्यों की कल्पना करने के लिए ग्राफ़ भी बना सकते हैं।
उदाहरण के लिए, पॉइंट वेरिएबल के लिए मानों के वितरण की कल्पना करने के लिए, हम सेल श्रेणी B2:B11 में मानों को हाइलाइट कर सकते हैं, फिर शीर्ष रिबन के साथ सम्मिलित करें टैब पर क्लिक करें, फिर ग्राफ़िक्स समूह में हिस्टोग्राम आइकन पर क्लिक करें :
निम्नलिखित हिस्टोग्राम स्वचालित रूप से बनाया जाएगा:
यह हिस्टोग्राम आपको खिलाड़ियों द्वारा बनाए गए अंकों के वितरण की कल्पना करने की अनुमति देता है।
उदाहरण के लिए, हम देख सकते हैं:
- 4 खिलाड़ियों ने 10 से 15 अंक के बीच स्कोर किया।
- 1 खिलाड़ी ने 15 से 20 अंक के बीच स्कोर किया।
- 2 खिलाड़ियों ने 20 से 25 अंक के बीच स्कोर किया।
- 3 खिलाड़ियों ने 25 से 30 अंक के बीच स्कोर किया।
हम प्रत्येक चर के लिए मानों के वितरण की कल्पना करने के लिए अपने डेटासेट में प्रत्येक चर के लिए इस प्रक्रिया को दोहरा सकते हैं।
चरण 4: लुप्त मानों की पहचान करें
हम कॉलम बी में लुप्त मानों की संख्या गिनने के लिए निम्नलिखित सूत्र का भी उपयोग कर सकते हैं:
=SUMPRODUCT(--NOT(ISNUMBER( B2:B11 )))
हम इस सूत्र को सेल B19 में टाइप कर सकते हैं, फिर डेटासेट में प्रत्येक चर के लिए लुप्त मानों की संख्या की गणना करने के लिए इसे दाईं ओर खींचें:
परिणाम से हम देख सकते हैं:
- पॉइंट कॉलम में 0 लुप्त मान हैं।
- रिबाउंड्स कॉलम में 2 लुप्त मान हैं।
- मदद कॉलम में 1 लुप्त मान है।
हमने अब इस डेटासेट पर कुछ बुनियादी खोजपूर्ण डेटा विश्लेषण पूरा कर लिया है और इस डेटासेट में प्रत्येक चर के लिए मान कैसे वितरित किए जाते हैं, इसकी काफी अच्छी समझ प्राप्त कर ली है।
संबंधित: एक्सेल में ब्लैंक सेल्स को जीरो से कैसे बदलें
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल बताते हैं कि एक्सेल में अन्य सामान्य कार्य कैसे करें:
एक्सेल में पांच नंबरों के सारांश की गणना कैसे करें
एक्सेल में समूह द्वारा औसत की गणना कैसे करें
एक्सेल में प्रति समूह अधिकतम मूल्य की गणना कैसे करें