Google 스프레드시트에서 상관 행렬을 만드는 방법


두 변수 사이의 관계를 정량화하는 한 가지 방법은 두 변수 사이의 선형 연관성을 측정 하는 Pearson 상관 계수를 사용하는 것입니다. -1과 1 사이의 값을 가집니다. 여기서:

  • -1은 두 변수 사이의 완벽한 음의 선형 상관 관계를 나타냅니다.
  • 0은 두 변수 사이에 선형 상관관계가 없음을 나타냅니다.
  • 1은 두 변수 사이의 완벽한 양의 선형 상관 관계를 나타냅니다.

상관 계수가 0에서 멀어질수록 두 변수 간의 관계가 더 강해집니다.

그러나 어떤 경우에는 여러 변수 쌍 간의 상관 관계를 이해하고 싶습니다. 이러한 경우 여러 쌍의 변수 조합 간의 상관 계수를 보여주는 정사각형 테이블인 상관 행렬을 만들 수 있습니다.

이 튜토리얼에서는 Google Sheets에서 상관 행렬을 만들고 해석하는 방법을 설명합니다.

Google 스프레드시트에서 상관 행렬을 만드는 방법

10명의 농구 선수에 대한 평균 득점, 리바운드, 어시스트 수를 보여주는 다음 데이터 세트가 있다고 가정해 보겠습니다.

이 데이터 세트에 대한 상관 행렬을 생성하려면 다음 구문과 함께 CORREL() 함수를 사용할 수 있습니다.

  COVAR(데이터_y, 데이터_x)

이 데이터세트의 공분산 행렬은 B15:D17 셀에 표시되고 공분산 행렬을 만드는 데 사용된 수식은 아래 B21:D23 셀에 표시됩니다.

Google 스프레드시트의 상관관계 매트릭스

상관 행렬을 해석하는 방법

상관 행렬의 개별 셀에 있는 값은 각 쌍별 변수 조합 간의 피어슨 상관 계수를 알려줍니다. 예를 들어:

득점과 리바운드의 상관관계: -0.0464. 포인트와 리바운드는 약간 음의 상관관계가 있지만 이 값은 0에 너무 가까워 이 두 변수 사이에 중요한 연관성이 있다는 강력한 증거가 없습니다.

포인트와 어시스트의 상관관계: 0.1219. 포인트와 어시스트는 약간 양의 상관관계가 있지만 이 값도 0에 매우 가깝기 때문에 이 두 변수 사이에 중요한 연관성이 있다는 강력한 증거는 없습니다.

리바운드와 어시스트의 상관관계: 0.7137. 리바운드와 어시스트는 강한 양의 상관관계가 있습니다. 즉, 리바운드가 많은 선수일수록 어시스트도 더 많은 경향이 있습니다.

변수와 자신 사이의 상관관계는 항상 1이기 때문에 상관행렬의 대각선 값은 모두 1이라는 점에 유의하세요. 실제로 이 숫자는 해석하는 데 유용하지 않습니다.

추가 리소스

상관 행렬을 읽는 방법
Excel에서 상관 행렬을 만드는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다