पांडा में एकाधिक डेटाफ़्रेम को कैसे मर्ज करें (उदाहरण के साथ)


आप पांडा में एक साथ कई डेटाफ़्रेम को मर्ज करने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:

 import pandas as pd
from functools import reduce

#define list of DataFrames
dfs = [df1, df2, df3]

#merge all DataFrames into one
final_df = reduce(lambda left,right: pd.merge (left,right,on=[' column_name '],
                                            how=' outer '), dfs)

निम्नलिखित उदाहरण दिखाता है कि व्यवहार में इस वाक्यविन्यास का उपयोग कैसे करें:

उदाहरण: पांडा में एकाधिक डेटाफ़्रेम मर्ज करें

मान लीजिए कि हमारे पास निम्नलिखित तीन पांडा डेटाफ़्रेम हैं जिनमें विभिन्न टीमों के बास्केटबॉल खिलाड़ियों के बारे में जानकारी है:

 import pandas as pd

#createDataFrames
df1 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D'],
                    ' points ': [18, 22, 19, 14]})

df2 = pd. DataFrame ({' team ': ['A', 'B', 'C'],
                    ' assists ': [4, 9, 14]})

df3 = pd. DataFrame ({' team ': ['C', 'D', 'E', 'F'],
                    ' rebounds ': [10, 17, 11, 10]})

#view DataFrames
print (df1)

  team points
0 to 18
1 B 22
2 C 19
3 D 14

print (df2)

  team assists
0 to 4
1 B 9
2 C 14

print (df3)

  team rebounds
0 C 10
1 D 17
2 E 11
3 F 10

हम तीन डेटाफ़्रेम को एक में मर्ज करने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:

 from functools import reduce

#define list of DataFrames
dfs = [df1, df2, df3]

#merge all DataFrames into one
final_df = reduce(lambda left,right: pd.merge (left,right,on=[' team '],
                                            how=' outer '), dfs)

#view merged DataFrame
print (final_df)

  team points assists rebounds
0 A 18.0 4.0 NaN
1 B 22.0 9.0 NaN
2 C 19.0 14.0 10.0
3 D 14.0 NaN 17.0
4 E NaN NaN 11.0
5 F NaN NaN 10.0

अंतिम परिणाम एक डेटाफ़्रेम है जिसमें तीनों डेटाफ़्रेम की जानकारी शामिल होती है।

ध्यान दें कि NaN मानों का उपयोग अंतिम डेटाफ़्रेम में खाली कोशिकाओं को भरने के लिए किया जाता है।

खाली कोशिकाओं को भरने के लिए NaN के अलावा किसी अन्य मान का उपयोग करने के लिए, आप fillna() फ़ंक्शन का उपयोग कर सकते हैं:

 from functools import reduce

#define list of DataFrames
dfs = [df1, df2, df3]

#merge all DataFrames into one
final_df = reduce(lambda left,right: pd.merge (left,right,on=[' team '],
                                            how=' outer '), dfs). fillna (' none ')

#view merged DataFrame
print (final_df)

  team points assists rebounds
0 A 18.0 4.0 none
1 B 22.0 9.0 none
2 C 19.0 14.0 10.0
3 D 14.0 none 17.0
4 E none none 11.0
5 F none none 10.0

प्रत्येक खाली कोशिका अब NaN के बजाय ” कोई नहीं ” से भर गई है।

नोट : आप पांडा में मर्ज फ़ंक्शन का पूरा दस्तावेज़ यहां पा सकते हैं।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि पांडा में अन्य सामान्य ऑपरेशन कैसे करें:

इंडेक्स पर दो पांडा डेटाफ़्रेम को कैसे मर्ज करें
पांडा डेटाफ़्रेम को अनेक स्तंभों में कैसे मर्ज करें
एकाधिक पांडा डेटाफ़्रेम को कैसे स्टैक करें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *