Cara menghitung koefisien korelasi intrakelas dengan python
Koefisien korelasi intrakelas (ICC) digunakan untuk menentukan apakah item atau topik dapat dinilai secara andal oleh penilai yang berbeda.
Nilai ICC dapat berkisar dari 0 hingga 1, dengan 0 menunjukkan tidak ada reliabilitas di antara penilai dan 1 menunjukkan reliabilitas sempurna.
Cara termudah untuk menghitung ICC dengan Python adalah dengan menggunakan fungsi penguin.intraclass_corr() dari paket statistik penguin , yang menggunakan sintaks berikut:
pengouin.intraclass_corr(data, target, evaluator, nilai)
Emas:
- data: Nama bingkai data
- target : Nama kolom yang berisi “target” (hal-hal yang diperhatikan)
- reviewer: Nama kolom yang berisi reviewer
- catatan: Nama kolom yang berisi catatan
Tutorial ini memberikan contoh praktis penggunaan fitur ini.
Langkah 1: Instal Penguin
Pertama-tama, Anda perlu menginstal Penguin:
pip install penguin
Langkah 2: Buat datanya
Misalkan empat juri berbeda diminta untuk mengevaluasi kualitas enam ujian masuk perguruan tinggi yang berbeda. Kita dapat membuat kerangka data berikut untuk menampung skor juri:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' exam ': [1, 2, 3, 4, 5, 6, 1, 2, 3, 4, 5, 6,
1, 2, 3, 4, 5, 6, 1, 2, 3, 4, 5, 6],
' judge ': ['A', 'A', 'A', 'A', 'A', 'A',
'B', 'B', 'B', 'B', 'B', 'B',
'C', 'C', 'C', 'C', 'C', 'C',
'D', 'D', 'D', 'D', 'D', 'D'],
' rating ': [1, 1, 3, 6, 6, 7, 2, 3, 8, 4, 5, 5,
0, 4, 1, 5, 5, 6, 1, 2, 3, 3, 6, 4]})
#view first five rows of DataFrame
df. head ()
exam judge rating
0 1 A 1
1 2 A 1
2 3 A 3
3 4 To 6
4 5 A 6
Langkah 3: Hitung koefisien korelasi intrakelas
Selanjutnya, kita akan menggunakan kode berikut untuk menghitung koefisien korelasi intrakelas:
import penguin as pg icc = pg. intraclass_corr (data=df, targets=' exam ', raters=' judge ', ratings=' rating ') icc. set_index (' Type ') Description ICC F df1 df2 pval CI95% Kind ICC1 Single raters absolute 0.505252 5.084916 5 18 0.004430 [0.11, 0.89] ICC2 Single random raters 0.503054 4.909385 5 15 0.007352 [0.1, 0.89] ICC3 Single fixed raters 0.494272 4.909385 5 15 0.007352 [0.09, 0.88] ICC1k Average raters absolute 0.803340 5.084916 5 18 0.004430 [0.33, 0.97] ICC2k Average random raters 0.801947 4.909385 5 15 0.007352 [0.31, 0.97] ICC3k Average fixed raters 0.796309 4.909385 5 15 0.007352 [0.27, 0.97]
Fungsi ini mengembalikan hasil berikut:
- Deskripsi: Jenis ICC yang dihitung
- ICC: Koefisien korelasi intrakelas (ICC)
- F: Nilai F dari ICC
- df1, df2 : derajat kebebasan yang berhubungan dengan nilai F
- pval: Nilai p yang terkait dengan nilai F
- CI95%: interval kepercayaan 95% untuk ICC
Perhatikan bahwa ada enam ICC berbeda yang dihitung di sini. Memang ada beberapa cara menghitung ICC berdasarkan asumsi berikut:
- Model: efek acak satu arah, efek acak dua arah, atau efek campuran dua arah
- Jenis hubungan: konsistensi atau kesepakatan mutlak
- Unit: penilai tunggal atau rata-rata penilai
Untuk penjelasan rinci mengenai asumsi tersebut, silakan merujuk ke artikel ini .