पायथन में इंट्राक्लास सहसंबंध गुणांक की गणना कैसे करें


एक इंट्राक्लास सहसंबंध गुणांक (आईसीसी) का उपयोग यह निर्धारित करने के लिए किया जाता है कि क्या वस्तुओं या विषयों को अलग-अलग मूल्यांकनकर्ताओं द्वारा विश्वसनीय रूप से रेट किया जा सकता है।

ICC का मान 0 से 1 तक हो सकता है, जिसमें 0 मूल्यांकनकर्ताओं के बीच कोई विश्वसनीयता नहीं होने का संकेत देता है और 1 पूर्ण विश्वसनीयता का संकेत देता है।

पायथन में ICC की गणना करने का सबसे आसान तरीका पेंगुइन सांख्यिकी पैकेज से Penguin.intraclass_corr() फ़ंक्शन का उपयोग करना है, जो निम्नलिखित सिंटैक्स का उपयोग करता है:

Pengouin.intraclass_corr(डेटा, लक्ष्य, मूल्यांकनकर्ता, ग्रेड)

सोना:

  • डेटा: डेटा फ़्रेम का नाम
  • लक्ष्य: “लक्ष्य” वाले कॉलम का नाम (नोट की जा रही बातें)
  • समीक्षक: समीक्षकों वाले कॉलम का नाम
  • नोट्स: नोट्स वाले कॉलम का नाम

यह ट्यूटोरियल इस सुविधा का उपयोग करने का एक व्यावहारिक उदाहरण प्रदान करता है।

चरण 1: पेंगुइन स्थापित करें

सबसे पहले, आपको पेंगुइन स्थापित करना होगा:

 pip install penguin

चरण 2: डेटा बनाएं

मान लीजिए कि चार अलग-अलग न्यायाधीशों को छह अलग-अलग कॉलेज प्रवेश परीक्षाओं की गुणवत्ता का मूल्यांकन करने के लिए कहा जाता है। हम जजों के स्कोर को रखने के लिए निम्नलिखित डेटाफ्रेम बना सकते हैं:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' exam ': [1, 2, 3, 4, 5, 6, 1, 2, 3, 4, 5, 6,
                            1, 2, 3, 4, 5, 6, 1, 2, 3, 4, 5, 6],
                   ' judge ': ['A', 'A', 'A', 'A', 'A', 'A',
                             'B', 'B', 'B', 'B', 'B', 'B',
                             'C', 'C', 'C', 'C', 'C', 'C',
                             'D', 'D', 'D', 'D', 'D', 'D'],
                   ' rating ': [1, 1, 3, 6, 6, 7, 2, 3, 8, 4, 5, 5,
                              0, 4, 1, 5, 5, 6, 1, 2, 3, 3, 6, 4]})

#view first five rows of DataFrame
df. head ()

	exam judge rating
0 1 A 1
1 2 A 1
2 3 A 3
3 4 To 6
4 5 A 6

चरण 3: इंट्राक्लास सहसंबंध गुणांक की गणना करें

इसके बाद, हम इंट्राक्लास सहसंबंध गुणांक की गणना करने के लिए निम्नलिखित कोड का उपयोग करेंगे:

 import penguin as pg

icc = pg. intraclass_corr (data=df, targets=' exam ', raters=' judge ', ratings=' rating ')

icc. set_index (' Type ')

        Description ICC F df1 df2 pval CI95%
Kind							
ICC1 Single raters absolute 0.505252 5.084916 5 18 0.004430 [0.11, 0.89]
ICC2 Single random raters 0.503054 4.909385 5 15 0.007352 [0.1, 0.89]
ICC3 Single fixed raters 0.494272 4.909385 5 15 0.007352 [0.09, 0.88]
ICC1k Average raters absolute 0.803340 5.084916 5 18 0.004430 [0.33, 0.97]
ICC2k Average random raters 0.801947 4.909385 5 15 0.007352 [0.31, 0.97]
ICC3k Average fixed raters 0.796309 4.909385 5 15 0.007352 [0.27, 0.97]

यह फ़ंक्शन निम्नलिखित परिणाम लौटाता है:

  • विवरण: ICC के प्रकार की गणना की गई
  • आईसीसी: इंट्राक्लास सहसंबंध गुणांक (आईसीसी)
  • एफ: आईसीसी का एफ मान
  • df1, df2: मान F से जुड़ी स्वतंत्रता की डिग्री
  • pval: F मान से संबद्ध p मान
  • सीआई95%: आईसीसी के लिए 95% विश्वास अंतराल

ध्यान दें कि यहां छह अलग-अलग आईसीसी की गणना की गई है। दरअसल, निम्नलिखित मान्यताओं के आधार पर आईसीसी की गणना करने के कई तरीके हैं:

  • मॉडल: एक-तरफ़ा यादृच्छिक प्रभाव, दो-तरफ़ा यादृच्छिक प्रभाव, या दो-तरफ़ा मिश्रित प्रभाव
  • रिश्ते का प्रकार: स्थिरता या पूर्ण सहमति
  • इकाई: एकल मूल्यांकनकर्ता या मूल्यांकनकर्ताओं का औसत

इन धारणाओं की विस्तृत व्याख्या के लिए कृपया इस लेख को देखें।

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *