Python'da ancova nasıl gerçekleştirilir?


Bir veya daha fazla ortak değişken kontrol edildikten sonra, üç veya daha fazla bağımsız grubun ortalamaları arasında istatistiksel olarak anlamlı bir fark olup olmadığını belirlemek için bir ANCOVA (“kovaryans analizi”) kullanılır .

Bu eğitimde Python’da ANCOVA’nın nasıl gerçekleştirileceği açıklanmaktadır.

Örnek: Python’da ANCOVA

Bir öğretmen, üç farklı çalışma tekniğinin sınav puanlarını etkileyip etkilemediğini bilmek istiyor ancak öğrencinin halihazırda sınıfta aldığı notu da hesaba katmak istiyor.

Aşağıdaki değişkenleri kullanarak bir ANCOVA gerçekleştirecektir:

  • Faktör değişkeni: teknik çalışma
  • Ortak değişken: mevcut puan
  • Yanıt değişkeni: sınav puanı

Bu veri kümesinde ANCOVA gerçekleştirmek için aşağıdaki adımları izleyin:

Adım 1: Verileri girin.

Öncelikle verilerimizi tutacak bir pandas DataFrame oluşturacağız:

 import numpy as np
import pandas as pd

#create data
df = pd.DataFrame({'technique': np.repeat(['A', 'B', 'C'], 5),
                   'current_grade': [67, 88, 75, 77, 85,
                                     92, 69, 77, 74, 88, 
                                     96, 91, 88, 82, 80],
                   'exam_score': [77, 89, 72, 74, 69,
                                  78, 88, 93, 94, 90,
                                  85, 81, 83, 88, 79]})
#view data 
df

   technical current_grade exam_score
0 A 67 77
1 A 88 89
2 A 75 72
3 A 77 74
4 A 85 69
5 B 92 78
6 B 69 88
7 B 77 93
8 B 74 94
9 B 88 90
10 C 96 85
11 C 91 81
12 C 88 83
13 C 82 88
14 C 80 79

Adım 2: ANCOVA’yı gerçekleştirin.

Daha sonra penguen kütüphanesindeki ancova() fonksiyonunu kullanarak bir ANCOVA gerçekleştireceğiz:

 pip install penguin 
from penguin import ancova

#perform ANCOVA
ancova(data= df , dv=' exam_score ', covar=' current_grade ', between=' technique ')


        Source SS DF F p-unc np2
0 technical 390.575130 2 4.80997 0.03155 0.46653
1 current_grade 4.193886 1 0.10329 0.75393 0.00930
2 Residual 446.606114 11 NaN NaN NaN

Adım 3: Sonuçları yorumlayın.

ANCOVA tablosundan çalışma tekniğine ait p değerinin (p-unc = “düzeltilmemiş p değeri”) 0,03155 olduğunu görüyoruz. Bu değer 0,05’ten küçük olduğundan, öğrencinin sınıftaki mevcut notu hesaba katıldıktan sonra bile her çalışma tekniğinin aynı ortalama sınav notuna yol açtığı yönündeki sıfır hipotezini reddedebiliriz.

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir