Cara menghitung koefisien korelasi intrakelas dengan python


Koefisien korelasi intrakelas (ICC) digunakan untuk menentukan apakah item atau topik dapat dinilai secara andal oleh penilai yang berbeda.

Nilai ICC dapat berkisar dari 0 hingga 1, dengan 0 menunjukkan tidak ada reliabilitas di antara penilai dan 1 menunjukkan reliabilitas sempurna.

Cara termudah untuk menghitung ICC dengan Python adalah dengan menggunakan fungsi penguin.intraclass_corr() dari paket statistik penguin , yang menggunakan sintaks berikut:

pengouin.intraclass_corr(data, target, evaluator, nilai)

Emas:

  • data: Nama bingkai data
  • target : Nama kolom yang berisi “target” (hal-hal yang diperhatikan)
  • reviewer: Nama kolom yang berisi reviewer
  • catatan: Nama kolom yang berisi catatan

Tutorial ini memberikan contoh praktis penggunaan fitur ini.

Langkah 1: Instal Penguin

Pertama-tama, Anda perlu menginstal Penguin:

 pip install penguin

Langkah 2: Buat datanya

Misalkan empat juri berbeda diminta untuk mengevaluasi kualitas enam ujian masuk perguruan tinggi yang berbeda. Kita dapat membuat kerangka data berikut untuk menampung skor juri:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' exam ': [1, 2, 3, 4, 5, 6, 1, 2, 3, 4, 5, 6,
                            1, 2, 3, 4, 5, 6, 1, 2, 3, 4, 5, 6],
                   ' judge ': ['A', 'A', 'A', 'A', 'A', 'A',
                             'B', 'B', 'B', 'B', 'B', 'B',
                             'C', 'C', 'C', 'C', 'C', 'C',
                             'D', 'D', 'D', 'D', 'D', 'D'],
                   ' rating ': [1, 1, 3, 6, 6, 7, 2, 3, 8, 4, 5, 5,
                              0, 4, 1, 5, 5, 6, 1, 2, 3, 3, 6, 4]})

#view first five rows of DataFrame
df. head ()

	exam judge rating
0 1 A 1
1 2 A 1
2 3 A 3
3 4 To 6
4 5 A 6

Langkah 3: Hitung koefisien korelasi intrakelas

Selanjutnya, kita akan menggunakan kode berikut untuk menghitung koefisien korelasi intrakelas:

 import penguin as pg

icc = pg. intraclass_corr (data=df, targets=' exam ', raters=' judge ', ratings=' rating ')

icc. set_index (' Type ')

        Description ICC F df1 df2 pval CI95%
Kind							
ICC1 Single raters absolute 0.505252 5.084916 5 18 0.004430 [0.11, 0.89]
ICC2 Single random raters 0.503054 4.909385 5 15 0.007352 [0.1, 0.89]
ICC3 Single fixed raters 0.494272 4.909385 5 15 0.007352 [0.09, 0.88]
ICC1k Average raters absolute 0.803340 5.084916 5 18 0.004430 [0.33, 0.97]
ICC2k Average random raters 0.801947 4.909385 5 15 0.007352 [0.31, 0.97]
ICC3k Average fixed raters 0.796309 4.909385 5 15 0.007352 [0.27, 0.97]

Fungsi ini mengembalikan hasil berikut:

  • Deskripsi: Jenis ICC yang dihitung
  • ICC: Koefisien korelasi intrakelas (ICC)
  • F: Nilai F dari ICC
  • df1, df2 : derajat kebebasan yang berhubungan dengan nilai F
  • pval: Nilai p yang terkait dengan nilai F
  • CI95%: interval kepercayaan 95% untuk ICC

Perhatikan bahwa ada enam ICC berbeda yang dihitung di sini. Memang ada beberapa cara menghitung ICC berdasarkan asumsi berikut:

  • Model: efek acak satu arah, efek acak dua arah, atau efek campuran dua arah
  • Jenis hubungan: konsistensi atau kesepakatan mutlak
  • Unit: penilai tunggal atau rata-rata penilai

Untuk penjelasan rinci mengenai asumsi tersebut, silakan merujuk ke artikel ini .

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *