Cara melakukan ancova dengan python


ANCOVA (“analisis kovarians”) digunakan untuk menentukan apakah terdapat perbedaan yang signifikan secara statistik antara rata-rata tiga atau lebih kelompok independen, setelah mengendalikan satu atau lebih kovariat .

Tutorial ini menjelaskan cara melakukan ANCOVA dengan Python.

Contoh: ANCOVA dengan Python

Seorang guru ingin mengetahui apakah tiga teknik belajar yang berbeda berdampak pada nilai ujian, namun dia ingin memperhitungkan nilai siswa saat ini di kelas.

Ini akan melakukan ANCOVA menggunakan variabel berikut:

  • Variabel faktor: teknis kajian
  • Kovariat: skor saat ini
  • Variabel respon: nilai ujian

Ikuti langkah-langkah berikut untuk melakukan ANCOVA pada kumpulan data ini:

Langkah 1: Masukkan datanya.

Pertama, kita akan membuat pandas DataFrame untuk menyimpan data kita:

 import numpy as np
import pandas as pd

#create data
df = pd.DataFrame({'technique': np.repeat(['A', 'B', 'C'], 5),
                   'current_grade': [67, 88, 75, 77, 85,
                                     92, 69, 77, 74, 88, 
                                     96, 91, 88, 82, 80],
                   'exam_score': [77, 89, 72, 74, 69,
                                  78, 88, 93, 94, 90,
                                  85, 81, 83, 88, 79]})
#view data 
df

   technical current_grade exam_score
0 A 67 77
1 A 88 89
2 A 75 72
3 A 77 74
4 A 85 69
5 B 92 78
6 B 69 88
7 B 77 93
8 B 74 94
9 B 88 90
10 C 96 85
11 C 91 81
12 C 88 83
13 C 82 88
14 C 80 79

Langkah 2: Lakukan ANCOVA.

Selanjutnya, kita akan melakukan ANCOVA menggunakan fungsi ancova() dari perpustakaan penguin:

 pip install penguin 
from penguin import ancova

#perform ANCOVA
ancova(data= df , dv=' exam_score ', covar=' current_grade ', between=' technique ')


        Source SS DF F p-unc np2
0 technical 390.575130 2 4.80997 0.03155 0.46653
1 current_grade 4.193886 1 0.10329 0.75393 0.00930
2 Residual 446.606114 11 NaN NaN NaN

Langkah 3: Interpretasikan hasilnya.

Dari tabel ANCOVA, kita melihat bahwa nilai p (p-unc = “nilai p yang tidak dikoreksi”) untuk teknik penelitian adalah 0,03155 . Karena nilai ini kurang dari 0,05, kita dapat menolak hipotesis nol yang menyatakan bahwa masing-masing teknik pembelajaran menghasilkan rata-rata nilai ujian yang sama, bahkan setelah memperhitungkan nilai siswa saat ini di kelas .

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *