İstatistiksel modellerde doğrusal regresyondan p değerleri nasıl çıkarılır?

İle Dr.benjamin anderson Temmuz 17, 2023 Rehber 0 Yorum

Python’daki statsmodels modülünü kullanarak doğrusal regresyon modeline uygun katsayılar için p değerlerini çıkarmak için aşağıdaki yöntemleri kullanabilirsiniz:

 #extract p-values for all predictor variables
for x in range(0, 3):
    print ( model.pvalues [x])

#extract p-value for specific predictor variable name
model. pvalues . loc [' predictor1 ']

#extract p-value for specific predictor variable position
model. pvalues [0]

Aşağıdaki örnekler her yöntemin pratikte nasıl kullanılacağını göstermektedir.

Örnek: İstatistiksel modellerde doğrusal regresyondan P değerlerini çıkarın

Belirli bir sınıftaki öğrencilerin çalışılan saatler, girilen hazırlık sınavları ve aldıkları final notları hakkında bilgi içeren aşağıdaki panda DataFrame’e sahip olduğumuzu varsayalım:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' hours ': [1, 2, 2, 4, 2, 1, 5, 4, 2, 4, 4, 3, 6],
                   ' exams ': [1, 3, 3, 5, 2, 2, 1, 1, 0, 3, 4, 3, 2],
                   ' score ': [76, 78, 85, 88, 72, 69, 94, 94, 88, 92, 90, 75, 96]})

#view head of DataFrame
df. head ()

	hours exam score
0 1 1 76
1 2 3 78
2 2 3 85
3 4 5 88
4 2 2 72

Tahmin edici değişkenler olarak “saatler” ve “sınavlar”ı ve yanıt değişkeni olarak “puan”ı kullanarak çoklu doğrusal regresyon modeline uyum sağlamak için statsmodels modülünün OLS() işlevini kullanabiliriz:

 import statsmodels. api as sm

#define predictor and response variables
y = df['score']
x = df[['hours', 'exams']]

#add constant to predictor variables
x = sm. add_constant (x)

#fit linear regression model
model = sm. OLS (y,x). fit ()

#view model summary
print ( model.summary ())

                            OLS Regression Results                            
==================================================== ============================
Dept. Variable: R-squared score: 0.718
Model: OLS Adj. R-squared: 0.661
Method: Least Squares F-statistic: 12.70
Date: Fri, 05 Aug 2022 Prob (F-statistic): 0.00180
Time: 09:24:38 Log-Likelihood: -38.618
No. Observations: 13 AIC: 83.24
Df Residuals: 10 BIC: 84.93
Df Model: 2                                         
Covariance Type: non-robust                                         
==================================================== ============================
                 coef std err t P>|t| [0.025 0.975]
-------------------------------------------------- ----------------------------
const 71.4048 4.001 17.847 0.000 62.490 80.319
hours 5.1275 1.018 5.038 0.001 2.860 7.395
exams -1.2121 1.147 -1.057 0.315 -3.768 1.344
==================================================== ============================
Omnibus: 1,103 Durbin-Watson: 1,248
Prob(Omnibus): 0.576 Jarque-Bera (JB): 0.803
Skew: -0.289 Prob(JB): 0.669
Kurtosis: 1.928 Cond. No. 11.7
==================================================== ============================

Varsayılan olarak, Summary() işlevi, her öngörücü değişkenin p değerlerini üç ondalık basamağa kadar görüntüler:

Kesişme için P değeri: 0,000
Saatler için P değeri: 0,001
Sınavlar için P değeri: 0,315

Bununla birlikte, aşağıdaki sözdizimini kullanarak her bir tahmin değişkeni için tam p değerlerini modelden çıkarabiliriz:

 #extract p-values for all predictor variables
for x in range(0, 3):
    print ( model.pvalues [x])

6.514115622692573e-09
0.0005077783375870773
0.3154807854805659

Bu, p değerlerini daha fazla ondalık basamakla görmemizi sağlar:

Kesişme için P değeri: 0,00000000651411562269257
Saatler için P değeri: 0,0005077783375870773
Sınavlar için P değeri: 0,3154807854805659

Not : Regresyon modelimizde toplam üç katsayı olduğundan range() fonksiyonumuzda 3 kullandık.

“Saat” değişkeninin p değerini özel olarak çıkarmak için aşağıdaki sözdizimini de kullanabiliriz:

 #extract p-value for 'hours' only
model. pvalues . loc [' hours ']

0.0005077783375870773

Veya regresyon modelinin belirli bir konumundaki bir değişkenin katsayısının p değerini çıkarmak için aşağıdaki sözdizimini kullanabiliriz:

 #extract p-value for coefficient in index position 0
model. pvalues [0]

6.514115622692573e-09

Ek kaynaklar

Aşağıdaki eğitimlerde Python’da diğer genel görevlerin nasıl gerçekleştirileceği açıklanmaktadır:

Python’da Lojistik Regresyon Nasıl Gerçekleştirilir
Python’da regresyon modellerinin AIC’si nasıl hesaplanır
Python’da düzeltilmiş R-kare nasıl hesaplanır

yazar hakkında

Dr.benjamin anderson

Merhaba, ben Benjamin, emekli bir istatistik profesörü ve Statorials öğretmenine dönüştüm. İstatistik alanındaki kapsamlı deneyimim ve uzmanlığımla, öğrencilerimi Statorials aracılığıyla güçlendirmek için bilgilerimi paylaşmaya can atıyorum. Daha fazlasını bil

Örnek: İstatistiksel modellerde doğrusal regresyondan P değerlerini çıkarın

Ek kaynaklar

yazar hakkında

Dr.benjamin anderson

Yorum ekle