Covariance.p와 excel의 covariance.s: 차이점은 무엇입니까?


통계에서 공분산은 한 변수의 변화가 다른 변수의 변화와 어떻게 연관되어 있는지 측정하는 방법입니다.

양의 공분산 값은 한 변수의 증가가 다른 변수의 증가와 연관되어 있음을 나타냅니다.

음수 값은 한 변수의 증가가 다른 변수의 감소와 연관되어 있음을 나타냅니다.

Excel에서 공분산을 계산하는 데 사용할 수 있는 두 가지 함수가 있습니다.

1. COVARIANCE.P: 이 함수는 모집단 공분산을 계산합니다. 값의 범위가 전체 모집단을 나타내는 경우 이 함수를 사용합니다.

이 함수는 다음 공식을 사용합니다.

모집단 공분산 = Σ(x ix )(y iy ) / n

금:

  • Σ: “합계”를 의미하는 그리스 기호
  • x i : 변수 x의 i 번째
  • x : 변수 x의 평균값
  • y i : 변수 y의 i번째
  • y : 변수 y의 평균값
  • n: 총 관측치 수

2. COVARIANCE.S: 이 함수는 표본 공분산을 계산합니다. 값의 범위가 전체 모집단이 아닌 값의 샘플을 나타내는 경우 이 함수를 사용합니다.

이 함수는 다음 공식을 사용합니다.

표본 공분산 = Σ(x ix )(y iy ) / (n-1)

금:

  • Σ: “합계”를 의미하는 그리스 기호
  • x i : 변수 x의 i 번째
  • x : 변수 x의 평균값
  • y i : 변수 y의 i번째
  • y : 변수 y의 평균값
  • n: 총 관측치 수

COVARIANCE.P는 n 으로 나누고 COVARIANCE.S는 n-1 로 나눕니다. 두 수식 사이의 미묘한 차이를 확인하세요.

이러한 이유로 COVARIANCE.S 수식은 더 작은 값으로 나누기 때문에 항상 더 큰 값을 생성합니다.

다음 예에서는 실제로 각 수식을 사용하는 방법을 보여줍니다.

예: Excel의 COVARIANCE.P와 COVARIANCE.S

15명의 농구 선수의 포인트와 어시스트를 보여주는 다음과 같은 데이터 세트가 Excel에 있다고 가정해 보겠습니다.

다음 스크린샷은 서로 다른 두 가지 공분산 공식을 사용하여 포인트와 어시스트 간의 공분산을 계산하는 방법을 보여줍니다.

표본 공분산은 15.69 이고 모집단 공분산은 14.64 입니다.

앞에서 언급했듯이 표본 공분산은 항상 모집단 공분산보다 큽니다.

COVARIANCE.P 또는 COVARIANCE.S를 사용하는 경우

대부분의 경우 전체 인구에 대한 데이터를 수집할 수 없습니다. 따라서 우리는 모집단 표본 에 대해서만 데이터를 수집합니다.

따라서 데이터 세트는 일반적으로 샘플을 나타내기 때문에 거의 항상 COVARIANCE.S를 사용하여 데이터 세트의 공분산을 계산합니다.

데이터가 전체 모집단을 나타내는 드문 경우에는 COVARIANCE.P 함수를 대신 사용할 수 있습니다.

추가 리소스

다음 자습서에서는 일반적으로 사용되는 다른 Excel 함수 간의 차이점을 설명합니다.

Excel의 STDEV.P와 STDEV.S: 차이점은 무엇입니까?
PERCENTILE.EXC와 Excel의 PERCENTILE.INC: 차이점은 무엇입니까?
Excel의 QUARTILE.EXC와 QUARTILE.INC: 차이점은 무엇입니까?

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다