산포도

이 문서에서는 산점도가 무엇인지 설명합니다. 따라서 포인트 클라우드의 용도, 포인트 클라우드 생성 방법, 포인트 클라우드 해석 방법 및 포인트 클라우드의 예를 알아보게 됩니다.

포인트 클라우드란 무엇입니까?

산점도(Scatterplot ) 또는 산점도(Scatterplot )는 두 변수의 데이터 세트가 두 개의 직교 좌표축에 그래프로 표시되는 통계 다이어그램의 한 유형입니다.

따라서 산점도는 두 통계 변수 간의 관계를 분석하는 데 사용됩니다.

산포도

산점도에는 상관관계도 또는 산점도 와 같이 여러 가지 다른 이름이 있습니다.

분산형 다이어그램은 파레토 차트, 원인 및 결과 다이어그램, 흐름도 등과 마찬가지로 품질 관리의 기본 도구 중 하나로 간주됩니다.

산점도를 만드는 방법

분산형 차트를 생성 하려면 다음 단계를 따라야 합니다.

  1. 분석하려는 샘플로부터 통계 데이터를 수집합니다. 산점도를 생성하려면 양적 변수가 두 개 이상 있어야 한다는 점을 명심하세요.
  2. 산점도의 두 축을 그립니다.
  3. 그래프로 표시할 두 가지 통계 변수를 결정합니다.
  4. 그래프의 각 축의 눈금을 보정합니다. 이렇게 하려면 먼저 각 변수의 최소값과 최대값을 찾고 이 값을 기반으로 각 축의 크기를 조정하는 것이 좋습니다.
  5. 산점도의 각 데이터 쌍을 점으로 표시합니다.
  6. 얻은 산점도를 분석하고 해석합니다.

산점도 예

분산형 다이어그램의 정의와 생성 이론을 살펴본 후, 이 섹션에서는 이러한 유형의 다이어그램을 예로 설명합니다.

  • 다음 빈도표에는 표본 학생 20명의 수학 및 통계 점수를 데이터로 수집하였다. 산점도에 데이터 세트를 표시하고 분석합니다.

산점도에서 데이터 시리즈를 나타내려면 두 개의 축을 플롯하고 이를 보정한 다음 각 데이터 쌍에 대해 그래프에 점을 플롯하면 됩니다. 그래프의 점은 각 값에 해당하는 가상 선의 교차점에 배치된다는 점을 기억하십시오.

포인트 클라우드의 예

산점도의 각 축은 변수를 나타냅니다. 보다 정확하게는 가로축은 수학 성적에 해당하고, 세로축은 통계학 성적에 해당한다.

산점도에서 볼 수 있듯이 한 변수가 증가하면 다른 변수도 증가하므로 두 변수는 양의 상관 관계를 갖습니다. 따라서 학생이 수학에서 좋은 성적을 받으면 통계에서도 좋은 성적을 얻을 가능성이 더 높고, 그 반대의 경우도 마찬가지라는 결론이 나옵니다.

그러나 이전 결론은 하나의 변수가 다른 변수의 원인이라는 것을 의미하지 않습니다. 수학에서 좋은 성적을 받았다고 아무것도 하지 않고 통계에서 좋은 성적이 자동으로 보장되는 것은 아니며, 오히려 두 과목을 모두 공부해야 하기 때문입니다. 다음 섹션에서는 이 개념에 대해 더 자세히 살펴보겠습니다.

산점도와 상관관계

분산형 다이어그램을 통해 두 변수 간의 상관 관계 유형을 식별할 수 있습니다.

  • 직접 상관관계(또는 양의 상관관계) : 한 변수가 증가하면 다른 변수도 증가합니다.
  • 역상관(또는 음의 상관) : 한 변수가 증가하면 다른 변수는 감소하고, 반대로 한 변수가 감소하면 다른 변수가 증가합니다.
  • 상관관계 없음(상관 없음) : 두 변수 사이에 관계가 없습니다.

마찬가지로, 두 변수 사이의 상관관계가 직접 상관관계인지 역상관관계인지에 관계없이 두 변수 사이의 관계의 강약에 따라 상관관계를 분류할 수도 있습니다.

  • 강한 상관관계: 두 변수가 밀접하게 연결되어 있습니다. 포인트는 포인트 클라우드에 모입니다. 이렇게 하면 변수 간의 관계를 더 쉽게 식별할 수 있습니다.
  • 낮은 상관관계 : 두 변수 사이에 관계가 존재하지만 식별하기 어렵습니다. 포인트 클라우드에서 포인트는 서로 멀리 떨어져 있습니다.
분산형 다이어그램과 두 변수 간의 상관관계

반면, 상관 관계는 공식을 사용하여 수치적으로 계산할 수도 있으므로 서로 다른 두 변수가 얼마나 밀접하게 관련되어 있는지 수학적으로 알 수 있습니다. 작동 방식을 보려면 다음 링크를 클릭하세요.

참조: 상관계수

두 변수 사이에 상관관계가 있다고 해서 두 변수 사이에 인과관계가 있다는 의미는 아닙니다. 즉, 두 변수 사이의 상관관계가 있다고 해서 한 변수의 변화가 다른 변수의 변화 원인이라는 의미는 아닙니다. 변하기 쉬운.

그래서 앞선 산점도처럼 수학 성적과 통계 성적 사이에는 양의 상관관계가 있지만, 수학에서 좋은 성적을 받았다고 해서 통계에서도 좋은 성적을 받는 것은 아니다. 수학만 공부하면 반드시 낙제하기 때문이다. 통계에서. 따라서 두 변수는 서로 관련되어 있지만 원인과 결과는 아닙니다.

자세한 내용을 알아보려면 다음 게시물을 계속 진행하세요.

포인트 클라우드의 장점과 단점

산점도의 특성으로 인해 이러한 유형의 통계 차트에는 장점과 단점이 있습니다.

이점:

  • 일련의 데이터를 산점도로 표현하는 것은 매우 간단합니다.
  • 산점도를 사용하면 두 변수 간의 관계를 시각적으로 분석하여 결론을 더 쉽게 도출할 수 있습니다.
  • 산점도는 심층 통계 연구에서 예비 데이터 탐색으로 사용될 수도 있습니다.

단점:

  • 이러한 유형의 다이어그램은 정성적 변수를 나타내는 데 유용하지 않습니다.
  • 산점도를 해석하면 두 변수 사이의 원인과 결과에 대한 잘못된 결론이 나올 수 있습니다.
  • 산점도를 사용하면 두 개 이상의 변수 간의 관계를 분석할 수 없습니다.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다