लंबा या चौड़ा डेटा: क्या अंतर है?
एक डेटासेट को दो अलग-अलग स्वरूपों में लिखा जा सकता है: चौड़ा और लंबा ।
एक विस्तृत प्रारूप में वे मान होते हैं जो पहले कॉलम में दोहराए नहीं जाते हैं।
एक लंबे प्रारूप में वे मान होते हैं जो पहले कॉलम में दोहराए जाते हैं ।
उदाहरण के लिए, निम्नलिखित दो डेटासेट पर विचार करें जिनमें विभिन्न स्वरूपों में व्यक्त बिल्कुल समान डेटा शामिल है:
ध्यान दें कि विस्तारित डेटासेट में, पहले कॉलम में प्रत्येक मान अद्वितीय है।
इसके विपरीत, लंबे डेटासेट में, पहले कॉलम में मान दोहराए जाते हैं।
दोनों डेटासेट में बिल्कुल एक जैसी टीम की जानकारी होती है, लेकिन इसे केवल अलग-अलग प्रारूपों में व्यक्त किया जाता है।
विस्तृत या लंबे डेटा का उपयोग कब करें
इस पर निर्भर करते हुए कि आप अपने डेटा के साथ क्या करना चाहते हैं, इसे विस्तृत या लंबे प्रारूप में प्रस्तुत करना अधिक सार्थक हो सकता है।
बड़े प्रारूप का उपयोग कब करें
एक सामान्य नियम के रूप में, यदि आप डेटा का विश्लेषण कर रहे हैं, तो आप आमतौर पर एक विस्तृत डेटा प्रारूप का उपयोग करेंगे।
उदाहरण के लिए, यदि आप टीम द्वारा बनाए गए औसत अंक, सहायता और रिबाउंड जानना चाहते हैं, तो डेटा को बड़े प्रारूप में रखना अक्सर आसान होता है:
वास्तविक दुनिया में आपके सामने आने वाले अधिकांश डेटा सेट भी विस्तृत प्रारूप में सहेजे जाएंगे क्योंकि हमारे दिमाग के लिए इसकी व्याख्या करना आसान है।
उदाहरण के लिए, उपरोक्त प्रारूप में, एक ही पंक्ति में प्रत्येक टीम के लिए अंक, सहायता और रिबाउंड मान को पढ़ना आसान है।
लंबे प्रारूप का उपयोग कब करें
आमतौर पर, यदि आप आर जैसे सांख्यिकीय सॉफ्टवेयर का उपयोग करके एक प्लॉट में कई चर देख रहे हैं, तो आपको आमतौर पर अपने डेटा को एक लंबे प्रारूप में परिवर्तित करने की आवश्यकता होती है ताकि सॉफ्टवेयर प्लॉट बना सके।
वास्तविक दुनिया के उदाहरणों के लिए, इन आर ट्यूटोरियल्स को देखें जहां कुछ प्रकार के प्लॉट बनाने के लिए डेटा लंबे प्रारूप में होना चाहिए:
- आर में एकाधिक घनत्व वाले प्लॉट कैसे प्लॉट करें
- आर में एकाधिक कॉलम कैसे प्लॉट करें
- आर में हीट मैप कैसे बनाएं
यदि आप भी पायथन का उपयोग कर रहे हैं तो कभी-कभी आपको अपने डेटा को एक अलग प्रारूप में दोबारा आकार देने की आवश्यकता हो सकती है।
निम्नलिखित ट्यूटोरियल बताते हैं कि पायथन में डेटा फ़्रेम को कैसे दोबारा आकार दिया जाए:
- पायथन में डेटा को लंबे से चौड़े तक कैसे दोबारा आकार दें
- पायथन में डेटा को वाइड से लॉन्ग में कैसे बदलें
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल आमतौर पर उपयोग किए जाने वाले अन्य सांख्यिकीय शब्दों पर जानकारी प्रदान करते हैं:
सांख्यिकी में अवलोकन क्या है?
सांख्यिकी में सहसंयोजक क्या है?
सांख्यिकी में अवशेष क्या हैं?