आप फ़ाइलों को जल्दी और आसानी से आयात करने के लिए R में data.table पैकेज के fread() फ़ंक्शन का उपयोग कर सकते हैं। यह फ़ंक्शन निम्नलिखित मूल सिंटैक्स का उपयोग करता है: library (data.table) df <- fread(" C:\\Users\\Path\\To\\My\\data.csv ") बड़ी फ़ाइलों...
आप पांडा डेटाफ़्रेम में ग्रुपबी निष्पादित करने और शर्त के साथ गिनती करने के लिए निम्नलिखित मूल वाक्यविन्यास का उपयोग कर सकते हैं: df. groupby (' var1 ')[' var2 ']. apply ( lambda x:(x==' val '). sum ()). reset_index (name=' count...
आप एक विशिष्ट शर्त के साथ पांडा डेटाफ़्रेम कॉलम में मानों की संख्या की गणना करने के लिए निम्नलिखित विधियों का उपयोग कर सकते हैं: विधि 1: शर्त के साथ एक कॉलम में मानों की गणना करें len(df[df[' col1 ']==' value1...
आप पांडा डेटाफ़्रेम में “गिनती” कॉलम जोड़ने के लिए निम्नलिखित मूल वाक्यविन्यास का उपयोग कर सकते हैं: df[' var1_count '] = df. groupby (' var1 ')[' var1 ']. transform (' count ') यह विशेष सिंटैक्स डेटाफ़्रेम में var1_count नामक कॉलम जोड़ता...
आप पांडा डेटाफ़्रेम के विशिष्ट कॉलम में NaN मानों को बदलने के लिए fillna() के साथ निम्नलिखित विधियों का उपयोग कर सकते हैं: विधि 1: किसी विशिष्ट कॉलम के साथ fillna() का उपयोग करें df[' col1 '] = df[' col1 ']....
आप पांडा बार प्लॉट में बार को एनोटेट करने के लिए निम्नलिखित विधियों का उपयोग कर सकते हैं: विधि 1: एक साधारण बार प्लॉट में बारों को एनोटेट करें ax = df. plot . bar () ax. bar_label ( ax.containers [...
कई सांख्यिकीय परीक्षण मानते हैं कि डेटा सेट सामान्य रूप से वितरित होते हैं। पायथन में इस परिकल्पना की जाँच करने के चार सामान्य तरीके हैं: 1. (दृश्य विधि) एक हिस्टोग्राम बनाएं। यदि हिस्टोग्राम लगभग “घंटी” के आकार का है, तो...
आप R में समूह द्वारा प्रतिशत की गणना करने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं: library (dplyr) df %>% group_by(group_var) %>% mutate(percent = value_var/sum(value_var)) निम्नलिखित उदाहरण दिखाता है कि व्यवहार में इस वाक्यविन्यास का उपयोग कैसे करें। उदाहरण:...
आंकड़ों में, अंतराल और इंटरक्वेर्टाइल रेंज डेटा सेट में मूल्यों के वितरण को मापने के दो तरीके हैं। रेंज किसी डेटा सेट में न्यूनतम मान और अधिकतम मान के बीच अंतर को मापती है। अंतरचतुर्थक श्रेणी डेटा सेट में पहले चतुर्थक...
सांख्यिकी में सबसे अधिक उपयोग की जाने वाली दो प्रक्रियाएं परिकल्पना परीक्षण और आत्मविश्वास अंतराल हैं। यहाँ दोनों के बीच अंतर है: परिकल्पना परीक्षण एक औपचारिक सांख्यिकीय परीक्षण है जिसका उपयोग यह निर्धारित करने के लिए किया जाता है कि जनसंख्या...