공분산 행렬

이 기사에서는 공분산 행렬이 무엇인지, 그 공식이 무엇인지 설명합니다. 구체적인 예와 공분산 행렬의 속성을 통해 공분산 행렬을 만드는 방법을 알아봅니다.

공분산 행렬이란 무엇입니까?

공분산 행렬은 연구된 변수의 분산과 공분산을 요소로 하는 정사각 행렬입니다. 따라서 공분산 행렬의 주대각선의 요소는 각 변수의 분산이고 나머지 요소는 변수 간의 공분산입니다.

통계에서 공분산 행렬은 두 개 이상의 확률 변수 간의 관계를 분석하는 데 사용됩니다. 공분산 행렬은 변수의 모든 공분산 값을 동시에 볼 수 있기 때문에 여러 변수 사이의 상관관계를 빠르게 해석할 수 있다는 점에서 매우 유용합니다.

공분산 행렬의 기호는 그리스 대문자 시그마(Σ)입니다.

공분산 행렬을 계산하는 방법

여러 통계변수의 공분산 행렬을 계산 하려면 다음 단계를 수행해야 합니다.

  1. 모든 변수의 분산을 계산합니다.
  2. 각 변수 쌍의 공분산을 계산합니다.
  3. 공분산 행렬을 구성합니다.
    • 변수 i 의 분산은 행렬의 주대각선, 보다 정확하게는 i,i 위치에 배치되어야 합니다.
    • 변수 ij 사이의 공분산은 행렬의 i,j 위치에 배치되어야 합니다.

따라서 공분산 행렬의 공식은 다음과 같습니다.

공분산 행렬

공분산 행렬 예

공분산 행렬의 정의를 본 후, 아래에서는 이러한 유형의 행렬이 어떻게 만들어지는지 단계별로 연습해 보겠습니다.

값이 다음과 같은 변수 X, Y 및 Z의 공분산 행렬을 계산합니다.

  • 엑스: 4, 7, 12, 5, 7
  • 그리고: 9, 15, 19, 6, 8
  • Z: 7, 2, 4, 6, 3

가장 먼저 해야 할 일은 모든 변수의 분산을 확인하는 것입니다.

Var(X)=7,6

Var(Y)=23,44

Var(Z)=3,44

참고: 간격 계산기

둘째, 각 변수 쌍 간의 공분산을 찾습니다.

Cov(X,Y)=11,2

Cov(X,Z)=-2,6

Cov(Y,Z)=-4,36

참고: 공분산 계산기

그리고 모든 분산과 공분산을 계산하고 나면 남은 것은 공분산 행렬을 만드는 것뿐입니다. 이를 위해 행렬의 주대각선에 분산 값을 배치하고 해당 위치에 공분산 값을 배치합니다.

\Sigma=\begin{pmatrix}Var(X)&Cov(X,Y)&Cov(X,Z)\\[1.5ex]Cov(Y,X)&Var(Y)&Cov(Y,Z)\\[1.5ex]Cov(Z,X)&Cov(Z,Y)&Var(Z)\end{pmatrix}

\Sigma=\begin{pmatrix}7,6&11,2&-2,6\\[1.5ex]11,2&23,44&-4,36\\[1.5ex]-2,6&-4,36&3,44\end{pmatrix}

보시다시피, 분산과 공분산을 행렬로 표현하면 변수를 해석하기가 매우 쉽습니다. 분산이 가장 큰 변수는 Y(23.44)입니다. 반면 변수 X와 Y는 직접적인 관계가 있는 반면 변수 X와 Z(따라서 Y와 Z)는 역의 관계를 갖습니다.

두 변수 사이의 공분산은 변수의 순서에 의존하지 않기 때문에 공분산 행렬은 항상 대칭입니다. 예를 들어,

Cov(X,Y)

동일하다

Cov(Y,X).

또한 공분산 행렬은 항상 정사각 행렬이며 해당 차원은 변수 수와 같습니다. 이 경우에는 세 개의 변수가 있으므로 3×3 행렬이 됩니다. 그러나 변수가 두 개만 있으면 공분산 행렬은 2×2가 됩니다.

공분산 행렬의 속성

공분산 행렬에는 다음과 같은 특징이 있습니다.

  • 공분산 행렬은 변수 개수 차수의 정사각 행렬입니다.
  • 공분산 행렬은 대칭형입니다. 이는 행렬의 주대각선이 대칭축임을 의미합니다.
  • 공분산 행렬은 항상 양의 준정부호입니다.
  • 공분산 행렬의 행렬식은 0보다 크거나 같습니다.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다