Spss에서 공분산 행렬을 만드는 방법


공분산은 한 변수의 변화가 두 번째 변수의 변화와 어떻게 연관되어 있는지를 측정한 것입니다. 보다 구체적으로 말하면 두 변수가 선형적으로 연관되는 정도를 측정하는 것입니다.

두 변수 XY 간의 공분산을 계산하는 공식은 다음과 같습니다.

COV( X , Y ) = Σ(x- x )(y- y ) / n

공분산 행렬은 데이터 세트의 서로 다른 변수 간의 공분산을 나타내는 정사각형 행렬입니다.

이 튜토리얼에서는 SPSS에서 주어진 데이터 세트에 대한 공분산 행렬을 만드는 방법을 설명합니다.

예: SPSS의 공분산 행렬

수학, 과학, 역사의 세 가지 과목에서 10명의 학생의 시험 점수를 보여주는 다음 데이터 세트가 있다고 가정합니다.

이 데이터 세트에 대한 공분산 행렬을 생성하려면 분석 탭, 상관 관계 , 이변량을 차례로 클릭합니다.

나타나는 새 창에서 세 변수를 각각 Variables 상자로 드래그합니다.

그런 다음 옵션 을 클릭합니다. 제품 간 차이 및 공분산 옆의 확인란을 선택합니다. 그런 다음 계속 을 클릭합니다.

그런 다음 확인을 클릭합니다. 결과는 새 창에 나타납니다:

SPSS의 공분산 행렬

각 변수 쌍별 조합에 대한 공분산을 얻으려면 제곱합과 벡터곱의 합을 N 으로 나누어야 합니다.

예를 들어, 수학과 과학의 공분산은 다음과 같이 계산할 수 있습니다.

COV(수학, 과학) = 332,000 / 10 = 33.2 .

마찬가지로 수학과 역사 사이의 공분산은 다음과 같이 계산할 수 있습니다.

COV(수학, 역사) = -244.400 / 10 = -24.44 .

제곱합과 벡터곱의 합을 N 으로 나누어 각 변수의 분산을 구할 수도 있습니다.

예를 들어 수학의 분산은 다음과 같이 계산할 수 있습니다.

VAR(수학) = 649.600 / 10 = 64.96 .

유사한 계산을 수행하여 이 데이터 세트에 대한 전체 공분산 행렬을 얻을 수 있습니다.

SPSS의 공분산 행렬

공분산 행렬을 해석하는 방법

공분산 행렬의 대각선에 있는 값은 단순히 각 개체의 분산입니다. 예를 들어:

  • 수학 결과의 분산은 64.96 입니다.
  • 과학 점수의 분산은 56.4 입니다.
  • 과거 점수의 분산은 75.56 입니다.

행렬의 다른 값은 서로 다른 대상 간의 공분산을 나타냅니다. 예를 들어:

  • 수학과 과학 점수 사이의 공분산은 33.2 입니다.
  • 수학과 역사 점수 사이의 공분산은 -24.44 입니다.
  • 과학 점수와 역사 점수 사이의 공분산은 -24.1 입니다.

공분산의 양수는 두 변수가 동시에 증가하거나 감소하는 경향이 있음을 나타냅니다. 예를 들어, 수학과 과학은 양의 공분산(33.2)을 가지며, 이는 수학에서 높은 점수를 받은 학생이 과학에서도 높은 점수를 받는 경향이 있음을 나타냅니다. 마찬가지로 수학 성적이 좋지 않은 학생은 과학 성적도 좋지 않은 경향이 있습니다.

공분산의 음수는 한 변수가 증가하면 두 번째 변수가 감소하는 경향이 있음을 나타냅니다. 예를 들어, 과학과 역사는 음의 공분산(-24.1)을 가지며, 이는 과학에서 높은 점수를 받은 학생이 역사에서 낮은 점수를 받는 경향이 있음을 나타냅니다. 마찬가지로, 과학에서 낮은 점수를 받은 학생들은 역사에서 높은 점수를 받는 경향이 있습니다.

추가 리소스

SPSS에서 상관 행렬을 만드는 방법
SPSS에서 부분 상관관계를 계산하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다