पांडा में 5 मिनट के अंतराल में समूह कैसे बनाएं


आप पांडा डेटाफ़्रेम में पंक्तियों को 5 मिनट के अंतराल में समूहित करने के लिए निम्नलिखित मूल वाक्यविन्यास का उपयोग कर सकते हैं:

 df. resample (' 5min '). sum ()

यह विशेष सूत्र मानता है कि आपके डेटाफ़्रेम के सूचकांक में डेटाटाइम मान शामिल हैं और डेटाफ़्रेम में प्रत्येक कॉलम के योग की गणना करता है, जिसे 5 मिनट के अंतराल में समूहीकृत किया जाता है।

निम्नलिखित उदाहरण दिखाता है कि व्यवहार में इस वाक्यविन्यास का उपयोग कैसे करें।

संबंधित: पांडा में पुनः नमूना() का परिचय

उदाहरण: पांडा में 5 मिनट के अंतराल में समूह कैसे बनाएं

मान लीजिए कि हमारे पास निम्नलिखित पांडा डेटाफ़्रेम हैं जो किसी कंपनी द्वारा विभिन्न तिथियों और समय पर की गई बिक्री को दर्शाते हैं:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' date ': pd.date_range (start=' 1/1/2020 ', freq=' min ', periods= 12 ),
                   ' sales ': [6, 8, 9, 11, 13, 8, 8, 15, 22, 9, 8, 4],
                   ' returns ': [0, 3, 2, 2, 1, 3, 2, 4, 1, 5, 3, 2]})

#set 'date' column as index
df = df. set_index (' date ')

#view DataFrame
print (df)

                     sales returns
date                               
2020-01-01 00:00:00 6 0
2020-01-01 00:01:00 8 3
2020-01-01 00:02:00 9 2
2020-01-01 00:03:00 11 2
2020-01-01 00:04:00 13 1
2020-01-01 00:05:00 8 3
2020-01-01 00:06:00 8 2
2020-01-01 00:07:00 15 4
2020-01-01 00:08:00 22 1
2020-01-01 00:09:00 9 5
2020-01-01 00:10:00 8 3
2020-01-01 00:11:00 4 2

संबंधित: पांडा में दिनांक सीमा कैसे बनाएं

हम 5 मिनट के अंतराल के आधार पर समूहीकृत बिक्री के योग की गणना करने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:

 #calculate sum of sales and returns grouped by 5-minute intervals
df. resample (' 5min '). sum ()

                     sales returns
date		
2020-01-01 00:00:00 47 8
2020-01-01 00:05:00 62 15
2020-01-01 00:10:00 12 5

यहां परिणाम की व्याख्या करने का तरीका बताया गया है:

  • 0-4 मिनट में कुल बिक्री 47 थी और कुल रिटर्न 8 था।
  • 5-9 मिनट में कुल बिक्री 62 थी और कुल रिटर्न 15 था।
  • 10-14 मिनट में कुल बिक्री 1 2 थी और कुल रिटर्न 5 था।

हम 5 मिनट के अंतराल में समूहीकृत अधिकतम बिक्री मूल्यों और रिटर्न मूल्यों की गणना करने के लिए समान वाक्यविन्यास का उपयोग कर सकते हैं:

 #calculate max of sales and max of returns grouped by 5-minute intervals
df. resample (' 5min '). max ()

	             sales returns
date		
2020-01-01 00:00:00 13 3
2020-01-01 00:05:00 22 5
2020-01-01 00:10:00 8 3

हम किसी भी मूल्य की गणना करने के लिए समान वाक्यविन्यास का उपयोग कर सकते हैं जिसे हम 5 मिनट के अंतराल में समूहीकृत करना चाहते हैं।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि पांडा में अन्य सामान्य ऑपरेशन कैसे करें:

पांडाओं के बीच दिन के हिसाब से समूह कैसे बनाएं
पांडा में सप्ताह के अनुसार समूह कैसे बनाएं
पंडों में महीने के हिसाब से समूह कैसे बनाएं
पंडों में तिमाही के आधार पर समूह कैसे बनाएं

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *