Python에서 클래스 내 상관 계수를 계산하는 방법


클래스 내 상관 계수 (ICC)는 다양한 평가자가 항목이나 주제를 안정적으로 평가할 수 있는지 여부를 결정하는 데 사용됩니다.

ICC 값의 범위는 0에서 1까지이며, 0은 평가자 간의 신뢰도가 없음을 나타내고 1은 완벽한 신뢰도를 나타냅니다.

Python에서 ICC를 계산하는 가장 쉬운 방법은 다음 구문을 사용하는 펭귄 통계 패키지Penguin.intraclass_corr() 함수를 사용하는 것입니다.

pengouin.intraclass_corr(데이터, 대상, 평가자, 성적)

금:

  • data: 데이터 프레임의 이름
  • targets: “대상”(주의 사항)을 포함하는 열의 이름
  • 리뷰어: 리뷰어가 포함된 열 이름
  • Notes: 메모가 포함된 열의 이름

이 튜토리얼에서는 이 기능을 사용하는 실제 예를 제공합니다.

1단계: 펭귄 설치

우선 펭귄을 설치해야 합니다.

 pip install penguin

2단계: 데이터 생성

4명의 심사위원에게 6가지 대학 입학 시험의 품질을 평가하도록 요청했다고 가정해 보겠습니다. 심사위원의 점수를 저장하기 위해 다음 데이터프레임을 만들 수 있습니다.

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' exam ': [1, 2, 3, 4, 5, 6, 1, 2, 3, 4, 5, 6,
                            1, 2, 3, 4, 5, 6, 1, 2, 3, 4, 5, 6],
                   ' judge ': ['A', 'A', 'A', 'A', 'A', 'A',
                             'B', 'B', 'B', 'B', 'B', 'B',
                             'C', 'C', 'C', 'C', 'C', 'C',
                             'D', 'D', 'D', 'D', 'D', 'D'],
                   ' rating ': [1, 1, 3, 6, 6, 7, 2, 3, 8, 4, 5, 5,
                              0, 4, 1, 5, 5, 6, 1, 2, 3, 3, 6, 4]})

#view first five rows of DataFrame
df. head ()

	exam judge rating
0 1 A 1
1 2 A 1
2 3 A 3
3 4 To 6
4 5 A 6

3단계: 클래스 내 상관 계수 계산

다음으로, 클래스 내 상관 계수를 계산하기 위해 다음 코드를 사용합니다.

 import penguin as pg

icc = pg. intraclass_corr (data=df, targets=' exam ', raters=' judge ', ratings=' rating ')

icc. set_index (' Type ')

        Description ICC F df1 df2 pval CI95%
Kind							
ICC1 Single raters absolute 0.505252 5.084916 5 18 0.004430 [0.11, 0.89]
ICC2 Single random raters 0.503054 4.909385 5 15 0.007352 [0.1, 0.89]
ICC3 Single fixed raters 0.494272 4.909385 5 15 0.007352 [0.09, 0.88]
ICC1k Average raters absolute 0.803340 5.084916 5 18 0.004430 [0.33, 0.97]
ICC2k Average random raters 0.801947 4.909385 5 15 0.007352 [0.31, 0.97]
ICC3k Average fixed raters 0.796309 4.909385 5 15 0.007352 [0.27, 0.97]

이 함수는 다음 결과를 반환합니다.

  • 설명: 계산된 ICC 유형
  • ICC: 클래스 내 상관 계수(ICC)
  • F: ICC의 F 값
  • df1, df2: F 값과 관련된 자유도
  • pval: F 값과 연관된 p 값
  • CI95%: ICC에 대한 95% 신뢰구간

여기서 계산된 6개의 서로 다른 ICC가 있습니다. 실제로 다음 가정을 기반으로 ICC를 계산하는 방법에는 여러 가지가 있습니다.

  • 모델: 단방향 무작위 효과, 양방향 무작위 효과 또는 양방향 혼합 효과
  • 관계 유형: 일관성 또는 절대적인 동의
  • 단위: 단일 평가자 또는 평가자의 평균

이러한 가정에 대한 자세한 설명은 이 문서를 참조하세요.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다