Excel에서 코사인 유사성을 계산하는 방법
코사인 유사성은 내부 곱 공간의 두 벡터 간의 유사성을 측정한 것입니다.
두 벡터 A와 B의 경우 코사인 유사성은 다음과 같이 계산됩니다.
코사인 유사성 = ΣA i B i / (√ΣA i 2 √ΣB i 2 )
이 튜토리얼에서는 Excel에서 벡터 간의 코사인 유사성을 계산하는 방법을 설명합니다.
Excel에서 두 벡터 간의 코사인 유사성
Excel에 다음 두 벡터가 있다고 가정합니다.
다음 공식을 사용하여 Excel에서 두 벡터 간의 코사인 유사성을 계산할 수 있습니다.
=SUMPRODUCT( A$2:A$9 , B2:B9 )/(SQRT(SUMSQ( B2:B9 ))*SQRT(SUMSQ( $A$2:$A$9 )))
다음 스크린샷은 이 수식을 사용하는 방법을 보여줍니다.
두 벡터 사이의 코사인 유사성은 0.965195 입니다.
코사인 유사성 값은 다음과 같이 해석됩니다.
- -1 값은 최대 차이점을 나타냅니다.
- 값이 0이면 두 벡터가 직교함을 나타냅니다.
- 값 1은 최대 유사성을 나타냅니다.
0.965195 값은 이 예에서 두 벡터 간의 유사성이 높다는 것을 나타냅니다.
추가 리소스
다음 튜토리얼에서는 다른 통계 소프트웨어에서 코사인 유사성을 계산하는 방법을 설명합니다.
코사인 유사성에 대한 자세한 설명은 다음 Wikipedia 문서를 참조하세요.