पायथन में cbind का उपयोग कैसे करें (r के बराबर)
R में cbind फ़ंक्शन, जो column-bind का संक्षिप्त रूप है, का उपयोग डेटा फ़्रेम को उनके कॉलम द्वारा एक साथ संयोजित करने के लिए किया जा सकता है।
हम पायथन में समतुल्य कार्य करने के लिए पांडा कॉन्सैट() फ़ंक्शन का उपयोग कर सकते हैं:
df3 = pd. concat ([df1, df2], axis= 1 )
निम्नलिखित उदाहरण दिखाते हैं कि व्यवहार में इस फ़ंक्शन का उपयोग कैसे करें।
उदाहरण 1: समान सूचकांक मानों के साथ पायथन में cbind का उपयोग करें
आइए मान लें कि हमारे पास निम्नलिखित दो पांडा डेटाफ़्रेम हैं:
import pandas as pd #define DataFrames df1 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E'], ' points ': [99, 91, 104, 88, 108]}) print (df1) team points 0 to 99 1 B 91 2 C 104 3 D 88 4 E 108 df2 = pd. DataFrame ({' assists ': ['A', 'B', 'C', 'D', 'E'], ' rebounds ': [22, 19, 25, 33, 29]}) print (df2) rebound assists 0 to 22 1 B 19 2 C 25 3 D 33 4 E 29
हम इन दो डेटाफ़्रेमों को उनके कॉलम द्वारा शीघ्रता से जोड़ने के लिए concat() फ़ंक्शन का उपयोग कर सकते हैं:
#column-bind two DataFrames into new DataFrame
df3 = pd. concat ([df1, df2], axis= 1 )
#view resulting DataFrame
df3
team points assists rebounds
0 to 99 to 22
1 B 91 B 19
2 C 104 C 25
3 D 88 D 33
4 E 108 E 29
उदाहरण 2: असमान सूचकांक मानों के साथ पायथन में cbind का उपयोग करना
आइए मान लें कि हमारे पास निम्नलिखित दो पांडा डेटाफ़्रेम हैं:
import pandas as pd #define DataFrames df1 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E'], ' points ': [99, 91, 104, 88, 108]}) print (df1) team points 0 to 99 1 B 91 2 C 104 3 D 88 4 E 108 df2 = pd. DataFrame ({' assists ': ['A', 'B', 'C', 'D', 'E'], ' rebounds ': [22, 19, 25, 33, 29]}) df2. index = [6, 7, 8, 9, 10] print (df2) rebound assists 6 to 22 7 B 19 8 C 25 9 D 33 10 E 29
ध्यान दें कि दोनों डेटाफ़्रेम में समान सूचकांक मान नहीं हैं।
यदि हम उन्हें एक साथ जोड़ने के लिए concat() फ़ंक्शन का उपयोग करने का प्रयास करते हैं, तो हमें निम्नलिखित परिणाम मिलेगा:
#attempt to column-bind two DataFrames
df3 = pd. concat ([df1, df2], axis= 1 )
#view resulting DataFrame
df3
team points assists rebounds
0 to 99.0 NaN NaN
1 B 91.0 NaN NaN
2 C 104.0 NaN NaN
3 D 88.0 NaN NaN
4 E 108.0 NaN NaN
6 NaN NaN A 22.0
7 NaN NaN B 19.0
8 NaN NaN C 25.0
9 NaN NaN D 33.0
10 NaN NaN E 29.0
यह वह परिणाम नहीं है जो हम चाहते थे।
इस समस्या को हल करने के लिए, हमें प्रत्येक डेटाफ़्रेम को एक साथ जोड़ने से पहले उसके सूचकांक को रीसेट करना होगा:
import pandas as pd #define DataFrames df1 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E'], ' points ': [99, 91, 104, 88, 108]}) df2 = pd. DataFrame ({' assists ': ['A', 'B', 'C', 'D', 'E'], ' rebounds ': [22, 19, 25, 33, 29]}) df2. index = [6, 7, 8, 9, 10] #reset index of each DataFrame df1. reset_index (drop= True , place= True ) df2. reset_index (drop= True , place= True ) #column-bind two DataFrames df3 = pd. concat ([df1, df2], axis= 1 ) #view resulting DataFrame df3 team points assists rebounds 0 to 99 to 22 1 B 91 B 19 2 C 104 C 25 3 D 88 D 33 4 E 108 E 29
ध्यान दें कि यह डेटाफ़्रेम पिछले उदाहरण में मिले डेटाफ़्रेम से मेल खाता है।
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल बताते हैं कि पायथन में अन्य सामान्य ऑपरेशन कैसे करें:
इंडेक्स पर दो पांडा डेटाफ़्रेम को कैसे मर्ज करें
पांडा डेटाफ़्रेम को अनेक स्तंभों में कैसे मर्ज करें
पंडों में VLOOKUP कैसे करें