पंडों के डेटाफ़्रेम में तिमाही के आधार पर समूह कैसे बनाएं (उदाहरण के साथ)


आप पांडा डेटाफ़्रेम में पंक्तियों को तिमाही के आधार पर समूहित करने के लिए निम्नलिखित मूल सिंटैक्स का उपयोग कर सकते हैं:

 #convert date column to datetime
df[' date '] = pd. to_datetime (df[' date '])

#calculate sum of values, grouped by quarter
df. groupby (df[' date ']. dt . to_period (' Q '))[' values ']. sum ()

यह विशेष सूत्र दिनांक कॉलम में पंक्तियों को तिमाही के आधार पर समूहित करता है और डेटाफ़्रेम में मानों के कॉलम के योग की गणना करता है।

निम्नलिखित उदाहरण दिखाता है कि व्यवहार में इस वाक्यविन्यास का उपयोग कैसे करें।

उदाहरण: पंडों में तिमाही के आधार पर समूह कैसे बनाएं

मान लीजिए कि हमारे पास निम्नलिखित पांडा डेटाफ़्रेम हैं जो किसी कंपनी द्वारा विभिन्न तिथियों पर की गई बिक्री को दर्शाते हैं:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' date ': pd. date_range (start='1/1/2022', freq='M', periods= 12 ),
                   ' sales ': [6, 8, 10, 5, 4, 8, 8, 3, 5, 14, 8, 3]})

#view DataFrame
print (df)

         dirty date
0 2022-01-31 6
1 2022-02-28 8
2 2022-03-31 10
3 2022-04-30 5
4 2022-05-31 4
5 2022-06-30 8
6 2022-07-31 8
7 2022-08-31 3
8 2022-09-30 5
9 2022-10-31 14
10 2022-11-30 8
11 2022-12-31 3

संबंधित: पांडा में दिनांक सीमा कैसे बनाएं

तिमाही के आधार पर समूहीकृत बिक्री के योग की गणना करने के लिए निम्नलिखित सिंटैक्स का उपयोग किया जा सकता है:

 #convert date column to datetime and subtract one week
df[' date '] = pd. to_datetime (df[' date '])

#calculate sum of sales, grouped by quarter
df. groupby (df[' date ']. dt . to_period (' Q '))[' sales ']. sum ()

date
2022Q1 24
2022Q2 17
2022Q3 16
2022Q4 25
Freq: Q-DEC, Name: sales, dtype: int64

यहां परिणाम की व्याख्या करने का तरीका बताया गया है:

  • पहली तिमाही के दौरान कुल 24 बिक्री हुईं।
  • दूसरी तिमाही के दौरान कुल 17 बिक्री हुईं।
  • तीसरी तिमाही के दौरान कुल 16 बिक्री हुईं।
  • चौथी तिमाही के दौरान कुल 25 बिक्री हुईं।

हम तिमाही के आधार पर समूहीकृत किसी अन्य मीट्रिक की गणना करने के लिए समान सिंटैक्स का उपयोग कर सकते हैं।

उदाहरण के लिए, हम इसके बजाय तिमाही के आधार पर समूहीकृत अधिकतम बिक्री मूल्य की गणना कर सकते हैं:

 #convert date column to datetime
df[' date '] = pd. to_datetime (df[' date '])

#calculate max of sales, grouped by quarter
df. groupby (df[' date ']. dt . to_period (' Q '))[' sales ']. max ()

date
2022Q1 10
2022Q2 8
2022Q3 8
2022Q4 14
Freq: Q-DEC, Name: sales, dtype: int64

यहां परिणाम की व्याख्या करने का तरीका बताया गया है:

  • पहली तिमाही के दौरान किसी एक महीने में अधिकतम बिक्री 10 थी।
  • दूसरी तिमाही के दौरान किसी एक महीने में अधिकतम बिक्री 8 थी।
  • तीसरी तिमाही के दौरान किसी एक महीने में अधिकतम बिक्री 8 थी।
  • चौथी तिमाही के दौरान किसी एक महीने में अधिकतम बिक्री 14 थी।

नोट : आप पांडा में ग्रुपबाय ऑपरेशन का पूरा दस्तावेज़ यहां पा सकते हैं।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि पांडा में अन्य सामान्य ऑपरेशन कैसे करें:

पांडास डेटाफ़्रेम में महीने के अनुसार समूह कैसे बनाएं
पांडास डेटाफ़्रेम में सप्ताह के अनुसार समूह कैसे बनाएं
पांडा: ग्रुपबी का उपयोग कैसे करें और सशर्त गिनती कैसे करें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *