Excel에서 코사인 유사성을 계산하는 방법


코사인 유사성은 내부 곱 공간의 두 벡터 간의 유사성을 측정한 것입니다.

두 벡터 A와 B의 경우 코사인 유사성은 다음과 같이 계산됩니다.

코사인 유사성 = ΣA i B i / (√ΣA i 2 √ΣB i 2 )

이 튜토리얼에서는 Excel에서 벡터 간의 코사인 유사성을 계산하는 방법을 설명합니다.

Excel에서 두 벡터 간의 코사인 유사성

Excel에 다음 두 벡터가 있다고 가정합니다.

다음 공식을 사용하여 Excel에서 두 벡터 간의 코사인 유사성을 계산할 수 있습니다.

 =SUMPRODUCT( A$2:A$9 , B2:B9 )/(SQRT(SUMSQ( B2:B9 ))*SQRT(SUMSQ( $A$2:$A$9 )))

다음 스크린샷은 이 수식을 사용하는 방법을 보여줍니다.

Excel의 코사인 유사성 공식

두 벡터 사이의 코사인 유사성은 0.965195 입니다.

코사인 유사성 값은 다음과 같이 해석됩니다.

  • -1 값은 최대 차이점을 나타냅니다.
  • 값이 0이면 두 벡터가 직교함을 나타냅니다.
  • 값 1은 최대 유사성을 나타냅니다.

0.965195 값은 이 예에서 두 벡터 간의 유사성이 높다는 것을 나타냅니다.

추가 리소스

다음 튜토리얼에서는 다른 통계 소프트웨어에서 코사인 유사성을 계산하는 방법을 설명합니다.

코사인 유사성에 대한 자세한 설명은 다음 Wikipedia 문서를 참조하세요.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다