पांडा: nan मानों को औसत से कैसे भरें (3 उदाहरण)

द्वारा डॉ. बेंजामिन एंडरसन जुलाई 21, 2023 मार्गदर्शक शून्य टिप्पणियां

आप पांडा डेटाफ़्रेम में NaN मानों को बदलने के लिए fillna() फ़ंक्शन का उपयोग कर सकते हैं।

इस सुविधा का उपयोग करने के तीन सामान्य तरीके यहां दिए गए हैं:

विधि 1: औसत वाले कॉलम में NaN मान भरें

 df[' col1 '] = df[' col1 ']. fillna (df[' col1 ']. mean ())

विधि 2: औसत के साथ कई कॉलमों में NaN मान भरें

 df[[' col1 ', ' col2 ']] = df[[' col1 ', ' col2 ']]. fillna (df[[' col1 ',' col2 ']]. mean ())

विधि 3: सभी कॉलमों में औसत के साथ NaN मान भरें

 df = df. fillna ( df.mean ())

निम्नलिखित उदाहरण दिखाते हैं कि निम्नलिखित पांडा डेटाफ़्रेम के साथ व्यवहार में प्रत्येक विधि का उपयोग कैसे करें:

 import numpy as np
import pandas as pd

#create DataFrame with some NaN values
df = pd. DataFrame ({' rating ': [np.nan, 85, np.nan, 88, 94, 90, 76, 75, 87, 86],
                   ' points ': [25, np.nan, 14, 16, 27, 20, 12, 15, 14, 19],
                   ' assists ': [5, 7, 7, np.nan, 5, 7, 6, 9, 9, 5],
                   ' rebounds ': [11, 8, 10, 6, 6, 9, 6, 10, 10, 7]})

#view DataFrame
df

        rating points assists rebounds
0 NaN 25.0 5.0 11
1 85.0 NaN 7.0 8
2 NaN 14.0 7.0 10
3 88.0 16.0 NaN 6
4 94.0 27.0 5.0 6
5 90.0 20.0 7.0 9
6 76.0 12.0 6.0 6
7 75.0 15.0 9.0 10
8 87.0 14.0 9.0 10
9 86.0 19.0 5.0 7

उदाहरण 1: औसत वाले कॉलम में NaN मान भरें

निम्नलिखित कोड दिखाता है कि रेटिंग कॉलम में NaN मानों को रेटिंग कॉलम के औसत मान के साथ कैसे भरें:

 #fill NaNs with column mean in 'rating' column
df[' rating '] = df[' rating ']. fillna (df[' rating ']. mean ())

#view updated DataFrame
df

	rating points assists rebounds
0 85.125 25.0 5.0 11
1 85,000 NaN 7.0 8
2 85.125 14.0 7.0 10
3 88,000 16.0 NaN 6
4 94,000 27.0 5.0 6
5 90,000 20.0 7.0 9
6 76,000 12.0 6.0 6
7 75,000 15.0 9.0 10
8 87,000 14.0 9.0 10
9 86,000 19.0 5.0 7

रेटिंग कॉलम में औसत मान 85.125 था, इसलिए रेटिंग कॉलम में प्रत्येक NaN मान उस मान से भर गया था।

उदाहरण 2: औसत के साथ कई कॉलमों में NaN मान भरें

निम्नलिखित कोड दिखाता है कि रेटिंग और पॉइंट कॉलम में NaN मानों को उनके संबंधित कॉलम औसत के साथ कैसे पॉप्युलेट किया जाए:

 #fill NaNs with column means in 'rating' and 'points' columns
df[[' rating ', ' points ']] = df[[' rating ', ' points ']]. fillna (df[[' rating ',' points ']]. mean ())

#view updated DataFrame
df

	rating points assists rebounds
0 85.125 25.0 5.0 11
1 85,000 18.0 7.0 8
2 85.125 14.0 7.0 10
3 88,000 16.0 NaN 6
4 94,000 27.0 5.0 6
5 90,000 20.0 7.0 9
6 76,000 12.0 6.0 6
7 75,000 15.0 9.0 10
8 87,000 14.0 9.0 10
9 86,000 19.0 5.0 7

ग्रेड और पॉइंट कॉलम में NaN मान उनके संबंधित कॉलम औसत के साथ पॉप्युलेट किए गए हैं।

उदाहरण 3: सभी कॉलमों में NaN मानों को औसत से भरें

निम्नलिखित कोड दिखाता है कि कॉलम औसत के साथ प्रत्येक कॉलम में NaN मान कैसे भरें:

 #fill NaNs with column means in each column 
df = df. fillna ( df.mean ())

#view updated DataFrame
df

        rating points assists rebounds
0 85.125 25.0 5.000000 11
1 85,000 18.0 7,000000 8
2 85.125 14.0 7.000000 10
3 88,000 16.0 6.666667 6
4 94,000 27.0 5,000000 6
5 90,000 20.0 7,000000 9
6 76,000 12.0 6,000000 6
7 75,000 15.0 9,000000 10
8 87,000 14.0 9,000000 10
9 86,000 19.0 5,000000 7

ध्यान दें कि प्रत्येक कॉलम में NaN मान उनके कॉलम के औसत से भरे गए हैं।

आप fillna() फ़ंक्शन के लिए संपूर्ण ऑनलाइन दस्तावेज़ यहां पा सकते हैं।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि पांडा में अन्य सामान्य ऑपरेशन कैसे करें:

पांडा में लुप्त मानों की गणना कैसे करें
पांडा में NaN मान वाली पंक्तियों को कैसे हटाएं
पांडा में विशिष्ट मान वाली पंक्तियों को कैसे हटाएं

लेखक के बारे में

डॉ. बेंजामिन एंडरसन

नमस्ते, मैं बेंजामिन हूं, एक सेवानिवृत्त सांख्यिकी प्रोफेसर जो अब समर्पित Statorials शिक्षक बन गया है। सांख्यिकी के क्षेत्र में व्यापक अनुभव और विशेषज्ञता के साथ, मैं Statorials के माध्यम से छात्रों को सशक्त बनाने के लिए अपना ज्ञान साझा करने के लिए उत्सुक हूं। अधिक जाने