स्किकिट-लर्न मॉडल से प्रतिगमन गुणांक कैसे निकालें


आप पायथन में स्किकिट-लर्न के साथ निर्मित रिग्रेशन मॉडल से रिग्रेशन गुणांक निकालने के लिए निम्नलिखित मूल वाक्यविन्यास का उपयोग कर सकते हैं:

 p.d. DataFrame ( zip ( X.columns , model.coef_ ))

निम्नलिखित उदाहरण दिखाता है कि व्यवहार में इस वाक्यविन्यास का उपयोग कैसे करें।

उदाहरण: स्किकिट-लर्न मॉडल से प्रतिगमन गुणांक निकालें

मान लीजिए कि हमारे पास निम्नलिखित पांडा डेटाफ़्रेम है जिसमें अध्ययन किए गए घंटों, ली गई तैयारी परीक्षाओं की संख्या और कक्षा में 11 छात्रों द्वारा अर्जित अंतिम परीक्षा ग्रेड के बारे में जानकारी शामिल है:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' hours ': [1, 2, 2, 4, 2, 1, 5, 4, 2, 4, 4],
                   ' exams ': [1, 3, 3, 5, 2, 2, 1, 1, 0, 3, 4],
                   ' score ': [76, 78, 85, 88, 72, 69, 94, 94, 88, 92, 90]})

#view DataFrame
print (df)

    hours exam score
0 1 1 76
1 2 3 78
2 2 3 85
3 4 5 88
4 2 2 72
5 1 2 69
6 5 1 94
7 4 1 94
8 2 0 88
9 4 3 92
10 4 4 90

हम भविष्यवक्ता चर के रूप में घंटों और परीक्षाओं का उपयोग करके और प्रतिक्रिया चर के रूप में स्कोर का उपयोग करके एकाधिक रैखिक प्रतिगमन मॉडल को फिट करने के लिए निम्नलिखित कोड का उपयोग कर सकते हैं:

 from sklearn. linear_model import LinearRegression

#initiate linear regression model
model = LinearRegression()

#define predictor and response variables
x, y = df[[' hours ', ' exams ']], df. score

#fit regression model
model. fit (x,y)

फिर हम घंटों और परीक्षाओं के प्रतिगमन गुणांक निकालने के लिए निम्नलिखित वाक्यविन्यास का उपयोग कर सकते हैं:

 #print regression coefficients
p.d. DataFrame ( zip ( X.columns , model.coef_ ))

            0 1
0 hours 5.794521
1 exams -1.157647

परिणाम से, हम मॉडल में दो भविष्यवक्ता चर के लिए प्रतिगमन गुणांक देख सकते हैं:

  • घंटों के लिए गुणांक: 5.794521
  • परीक्षा हेतु गुणांक:-1.157647

यदि हम चाहें तो प्रतिगमन मॉडल से मूल मान निकालने के लिए निम्नलिखित सिंटैक्स का भी उपयोग कर सकते हैं:

 #print intercept value
print (model. intercept_ )

70.48282057040197

इनमें से प्रत्येक मान का उपयोग करके, हम फिटेड रिग्रेशन मॉडल के लिए समीकरण लिख सकते हैं:

स्कोर = 70.483 + 5.795 (घंटे) – 1.158 (परीक्षा)

फिर हम अध्ययन में बिताए गए घंटों की संख्या और ली गई अभ्यास परीक्षाओं की संख्या के आधार पर किसी छात्र के अंतिम परीक्षा ग्रेड की भविष्यवाणी करने के लिए इस समीकरण का उपयोग कर सकते हैं।

उदाहरण के लिए, एक छात्र जिसने 3 घंटे अध्ययन किया और 2 प्रारंभिक परीक्षाएं दीं, उसे 85.55 का अंतिम ग्रेड प्राप्त करना चाहिए:

  • स्कोर = 70.483 + 5.795 (घंटे) – 1.158 (परीक्षा)
  • स्कोर = 70.483 + 5.795(3) – 1.158(2)
  • स्कोर = 85.55

संबंधित: प्रतिगमन गुणांक की व्याख्या कैसे करें

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि पायथन में अन्य सामान्य ऑपरेशन कैसे करें:

पायथन में सरल रैखिक प्रतिगमन कैसे करें
पायथन में मल्टीपल लीनियर रिग्रेशन कैसे करें
पायथन में प्रतिगमन मॉडल के एआईसी की गणना कैसे करें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *