पांडा: प्रत्येक पंक्ति के लिए मानक विचलन की गणना कैसे करें
आप पांडा डेटाफ़्रेम की प्रत्येक पंक्ति के लिए मानों के मानक विचलन की गणना करने के लिए निम्नलिखित मूल वाक्यविन्यास का उपयोग कर सकते हैं:
df. std (axis= 1 , numeric_only= True )
axis=1 तर्क पांडा को प्रत्येक पंक्ति (प्रत्येक कॉलम के बजाय) के लिए गणना करने के लिए कहता है और numeric_only=True गणना करते समय पांडा को केवल संख्यात्मक कॉलम पर विचार करने के लिए कहता है।
निम्नलिखित उदाहरण दिखाता है कि व्यवहार में इस वाक्यविन्यास का उपयोग कैसे करें।
उदाहरण: पांडा में प्रत्येक पंक्ति के लिए मानक विचलन की गणना करें
मान लीजिए कि हमारे पास निम्नलिखित पांडा डेटाफ़्रेम है जिसमें चार अलग-अलग खेलों के दौरान विभिन्न बास्केटबॉल खिलाड़ियों द्वारा बनाए गए अंकों के बारे में जानकारी है:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' player ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
' game1 ': [18, 22, 19, 14, 14, 11, 20, 28],
' game2 ': [5, 7, 7, 9, 12, 9, 9, 4],
' game3 ': [11, 8, 10, 6, 6, 5, 9, 12],
' game4 ': [9, 8, 8, 9, 14, 15, 10, 11]})
#view DataFrame
print (df)
player game1 game2 game3 game4
0 A 18 5 11 9
1 B 22 7 8 8
2 C 19 7 10 8
3 D 14 9 6 9
4 E 14 12 6 14
5 F 11 9 5 15
6 G 20 9 9 10
7:28 4 12 11
हम प्रत्येक खिलाड़ी द्वारा अर्जित अंकों के मानक विचलन की गणना करने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:
#calculate standard deviation for each row
df. std (axis= 1 , numeric_only= True )
0 5.439056
1 7.182154
2 5.477226
3 3.316625
4 3.785939
5 4.163332
6 5.354126
7 10.144785
dtype:float64
यहां परिणाम की व्याख्या करने का तरीका बताया गया है:
- खिलाड़ी A द्वारा अर्जित अंकों का मानक विचलन 5.439 है।
- खिलाड़ी B द्वारा अर्जित अंकों का मानक विचलन 7.182 है।
- खिलाड़ी C द्वारा अर्जित अंकों का मानक विचलन 5.477 है।
और इसी तरह।
ध्यान दें कि std() फ़ंक्शन डिफ़ॉल्ट रूप से नमूना मानक विचलन की गणना करता है।
यदि आप इसके बजाय जनसंख्या मानक विचलन की गणना करना चाहते हैं, तो आपको ddof=0 तर्क का उपयोग करना होगा:
#calculate population standard deviation for each row
df. std (axis= 1 , ddof= 0 , numeric_only= True )
0 4.747351
1 5.881366
2 4.807037
3 3.384910
4 3.983518
5 3.915150
6 4.892772
7 8.091179
dtype:float64
सम्बंधित: जनसंख्या बनाम नमूना मानक विचलन: प्रत्येक का उपयोग कब करें
किसी नए कॉलम में मानक विचलन मान निर्दिष्ट करने के लिए, आप निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:
#add new column to display standard deviation for each row
df[' std_points '] = df. std (axis= 1 , numeric_only= True )
#view updated DataFrame
print (df)
player game1 game2 game3 game4 points_std
0 A 18 5 11 9 5.439056
1 B 22 7 8 8 7.182154
2 C 19 7 10 8 5.477226
3 D 14 9 6 9 3.316625
4 E 14 12 6 14 3.785939
5 F 11 9 5 15 4.163332
6 G 20 9 9 10 5.354126
7:28 AM 4 12 11 10.144785
गेम1 , गेम2 , गेम3 और गेम4 कॉलम में प्रत्येक पंक्ति के लिए मानों का मानक विचलन अब पॉइंट_एसटीडी कॉलम में प्रदर्शित होता है।
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल बताते हैं कि पांडा में अन्य सामान्य ऑपरेशन कैसे करें:
पांडा डेटाफ़्रेम की पहली पंक्ति कैसे प्राप्त करें
पंडों के डेटाफ़्रेम में पहली पंक्ति को कैसे हटाएं
पांडास डेटाफ़्रेम में एक पंक्ति कैसे सम्मिलित करें