Covariance.p와 excel의 covariance.s: 차이점은 무엇입니까?

에 의해 벤자민 앤더슨 7월 16, 2023 가이드 댓글 0개

통계에서 공분산은 한 변수의 변화가 다른 변수의 변화와 어떻게 연관되어 있는지 측정하는 방법입니다.

양의 공분산 값은 한 변수의 증가가 다른 변수의 증가와 연관되어 있음을 나타냅니다.

음수 값은 한 변수의 증가가 다른 변수의 감소와 연관되어 있음을 나타냅니다.

Excel에서 공분산을 계산하는 데 사용할 수 있는 두 가지 함수가 있습니다.

1. COVARIANCE.P: 이 함수는 모집단 공분산을 계산합니다. 값의 범위가 전체 모집단을 나타내는 경우 이 함수를 사용합니다.

이 함수는 다음 공식을 사용합니다.

모집단 공분산 = Σ(x _i – x )(y _i – y ) / n

금:

2. COVARIANCE.S: 이 함수는 표본 공분산을 계산합니다. 값의 범위가 전체 모집단이 아닌 값의 샘플을 나타내는 경우 이 함수를 사용합니다.

이 함수는 다음 공식을 사용합니다.

표본 공분산 = Σ(x _i – x )(y _i – y ) / (n-1)

금:

COVARIANCE.P는 n 으로 나누고 COVARIANCE.S는 n-1 로 나눕니다. 두 수식 사이의 미묘한 차이를 확인하세요.

이러한 이유로 COVARIANCE.S 수식은 더 작은 값으로 나누기 때문에 항상 더 큰 값을 생성합니다.

다음 예에서는 실제로 각 수식을 사용하는 방법을 보여줍니다.

예: Excel의 COVARIANCE.P와 COVARIANCE.S

15명의 농구 선수의 포인트와 어시스트를 보여주는 다음과 같은 데이터 세트가 Excel에 있다고 가정해 보겠습니다.

다음 스크린샷은 서로 다른 두 가지 공분산 공식을 사용하여 포인트와 어시스트 간의 공분산을 계산하는 방법을 보여줍니다.

표본 공분산은 15.69 이고 모집단 공분산은 14.64 입니다.

앞에서 언급했듯이 표본 공분산은 항상 모집단 공분산보다 큽니다.

대부분의 경우 전체 인구에 대한 데이터를 수집할 수 없습니다. 따라서 우리는 모집단 표본 에 대해서만 데이터를 수집합니다.

따라서 데이터 세트는 일반적으로 샘플을 나타내기 때문에 거의 항상 COVARIANCE.S를 사용하여 데이터 세트의 공분산을 계산합니다.

데이터가 전체 모집단을 나타내는 드문 경우에는 COVARIANCE.P 함수를 대신 사용할 수 있습니다.

다음 자습서에서는 일반적으로 사용되는 다른 Excel 함수 간의 차이점을 설명합니다.

안녕하세요. 저는 통계학 교수를 퇴직하고 전임 통계 교사로 변신한 벤자민입니다. 통계 분야의 광범위한 경험과 전문 지식을 바탕으로 Statorials를 통해 학생들에게 힘을 실어주기 위해 지식을 공유하고 싶습니다. 더 알아보기