पंडों के डेटाफ़्रेम में तिमाही के आधार पर समूह कैसे बनाएं (उदाहरण के साथ)
आप पांडा डेटाफ़्रेम में पंक्तियों को तिमाही के आधार पर समूहित करने के लिए निम्नलिखित मूल सिंटैक्स का उपयोग कर सकते हैं:
#convert date column to datetime df[' date '] = pd. to_datetime (df[' date ']) #calculate sum of values, grouped by quarter df. groupby (df[' date ']. dt . to_period (' Q '))[' values ']. sum ()
यह विशेष सूत्र दिनांक कॉलम में पंक्तियों को तिमाही के आधार पर समूहित करता है और डेटाफ़्रेम में मानों के कॉलम के योग की गणना करता है।
निम्नलिखित उदाहरण दिखाता है कि व्यवहार में इस वाक्यविन्यास का उपयोग कैसे करें।
उदाहरण: पंडों में तिमाही के आधार पर समूह कैसे बनाएं
मान लीजिए कि हमारे पास निम्नलिखित पांडा डेटाफ़्रेम हैं जो किसी कंपनी द्वारा विभिन्न तिथियों पर की गई बिक्री को दर्शाते हैं:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' date ': pd. date_range (start='1/1/2022', freq='M', periods= 12 ),
' sales ': [6, 8, 10, 5, 4, 8, 8, 3, 5, 14, 8, 3]})
#view DataFrame
print (df)
dirty date
0 2022-01-31 6
1 2022-02-28 8
2 2022-03-31 10
3 2022-04-30 5
4 2022-05-31 4
5 2022-06-30 8
6 2022-07-31 8
7 2022-08-31 3
8 2022-09-30 5
9 2022-10-31 14
10 2022-11-30 8
11 2022-12-31 3
संबंधित: पांडा में दिनांक सीमा कैसे बनाएं
तिमाही के आधार पर समूहीकृत बिक्री के योग की गणना करने के लिए निम्नलिखित सिंटैक्स का उपयोग किया जा सकता है:
#convert date column to datetime and subtract one week df[' date '] = pd. to_datetime (df[' date ']) #calculate sum of sales, grouped by quarter df. groupby (df[' date ']. dt . to_period (' Q '))[' sales ']. sum () date 2022Q1 24 2022Q2 17 2022Q3 16 2022Q4 25 Freq: Q-DEC, Name: sales, dtype: int64
यहां परिणाम की व्याख्या करने का तरीका बताया गया है:
- पहली तिमाही के दौरान कुल 24 बिक्री हुईं।
- दूसरी तिमाही के दौरान कुल 17 बिक्री हुईं।
- तीसरी तिमाही के दौरान कुल 16 बिक्री हुईं।
- चौथी तिमाही के दौरान कुल 25 बिक्री हुईं।
हम तिमाही के आधार पर समूहीकृत किसी अन्य मीट्रिक की गणना करने के लिए समान सिंटैक्स का उपयोग कर सकते हैं।
उदाहरण के लिए, हम इसके बजाय तिमाही के आधार पर समूहीकृत अधिकतम बिक्री मूल्य की गणना कर सकते हैं:
#convert date column to datetime df[' date '] = pd. to_datetime (df[' date ']) #calculate max of sales, grouped by quarter df. groupby (df[' date ']. dt . to_period (' Q '))[' sales ']. max () date 2022Q1 10 2022Q2 8 2022Q3 8 2022Q4 14 Freq: Q-DEC, Name: sales, dtype: int64
यहां परिणाम की व्याख्या करने का तरीका बताया गया है:
- पहली तिमाही के दौरान किसी एक महीने में अधिकतम बिक्री 10 थी।
- दूसरी तिमाही के दौरान किसी एक महीने में अधिकतम बिक्री 8 थी।
- तीसरी तिमाही के दौरान किसी एक महीने में अधिकतम बिक्री 8 थी।
- चौथी तिमाही के दौरान किसी एक महीने में अधिकतम बिक्री 14 थी।
नोट : आप पांडा में ग्रुपबाय ऑपरेशन का पूरा दस्तावेज़ यहां पा सकते हैं।
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल बताते हैं कि पांडा में अन्य सामान्य ऑपरेशन कैसे करें:
पांडास डेटाफ़्रेम में महीने के अनुसार समूह कैसे बनाएं
पांडास डेटाफ़्रेम में सप्ताह के अनुसार समूह कैसे बनाएं
पांडा: ग्रुपबी का उपयोग कैसे करें और सशर्त गिनती कैसे करें