Spss에서 상자 그림을 만들고 해석하는 방법


상자 그림은 다음을 포함하는 데이터 세트의 5자리 요약을 시각화하는 데 사용됩니다.

  • 최저한의
  • 첫 번째 사분위수
  • 중앙값
  • 3분위수
  • 최대

이 튜토리얼에서는 SPSS에서 상자 그림을 만들고 편집하는 방법을 설명합니다.

SPSS에서 단일 상자 그림을 만드는 방법

특정 팀의 농구 선수 16명이 경기당 득점한 평균 점수를 보여주는 다음 데이터세트가 있다고 가정해 보겠습니다.

이러한 데이터 값의 분포를 시각화하기 위해 상자 그림을 만들려면 분석 탭, 기술 통계 , 탐색을 차례로 클릭하면 됩니다.

그러면 다음 창이 나타납니다:

상자 그림을 생성하려면 변수 점을 종속 목록(Dependent List) 영역으로 드래그합니다. 그런 다음 상자 하단의 표시 옵션에서 플롯이 선택되어 있는지 확인하세요.

확인 을 클릭하면 다음 상자 그림이 나타납니다.

SPSS의 상자 그림

이 상자 그림을 해석하는 방법은 다음과 같습니다.

SPSS에서 상자 그림 해석

이상값에 대한 참고 사항

IQR(사분위간 범위)은 세 번째 사분위수와 첫 번째 사분위수 사이의 거리입니다. SPSS는 모든 데이터 값이 세 번째 사분위수 위 IQR의 1.5배 또는 첫 번째 사분위수 아래 IQR의 1.5배인 경우 이상값으로 간주합니다.

특이치는 SPSS에서 작은 원으로 표시됩니다. 이전 예에서는 이상값이 없었으므로 상자 그림에 작은 원이 표시되지 않았습니다. 그러나 데이터 세트의 가장 큰 값이 실제로 50인 경우 상자 그림에는 이상값을 나타내는 작은 원이 표시됩니다.

SPSS의 상자 그림 특이치

데이터 세트에 이상값이 있는 경우 다음과 같은 몇 가지 옵션이 있습니다.

  • 이상값이 데이터 입력 오류가 아닌지 확인하세요. 때로는 데이터 값이 단순히 잘못 기록되는 경우도 있습니다. 이상값이 있는 경우 먼저 값을 올바르게 입력했는지, 오류가 아닌지 확인하세요.
  • 이상값에 새 값을 할당합니다 . 이상값이 데이터 입력 오류의 결과인 것으로 판명되면 데이터 세트의 평균이나 중앙값 과 같은 새 값을 할당하기로 결정할 수 있습니다.
  • 이상치를 제거합니다. 값이 실제로 이상값인 경우 전체 분석에 상당한 영향을 미칠 경우 해당 값을 제거하도록 선택할 수 있습니다. 최종 보고서나 분석에서 이상치를 제거했다는 사실을 꼭 언급하세요.

SPSS에서 다중 상자 그림을 만드는 방법

변수가 여러 개인 경우 SPSS는 여러 개의 상자 그림을 나란히 만들 수도 있습니다. 예를 들어, 서로 다른 세 팀의 선수 16명이 득점한 평균 점수에 대한 다음 데이터가 있다고 가정합니다.

이러한 각 변수에 대한 상자 그림을 만들려면 분석 탭을 다시 클릭한 다음 기술 통계 , 탐색을 차례로 클릭하면 됩니다. 그런 다음 세 개의 변수를 종속 목록 (Dependent List) 이라고 표시된 영역으로 드래그할 수 있습니다.

OK를 클릭하면 다음 상자 그림이 나타납니다.

SPSS의 다중 상자 그림

이를 통해 세 팀 간의 분포 차이를 쉽게 시각화할 수 있습니다.

우리는 또한 다음을 관찰할 수 있습니다:

  • 경기당 득점 중앙값은 B팀이 가장 높고 C팀이 가장 낮습니다.
  • A팀과 C팀에 비해 B팀의 박스 플롯 길이에서 알 수 있듯이 게임당 득점 점수의 변화는 B팀에서 가장 높습니다.
  • 게임당 가장 많은 점수를 얻은 플레이어가 B팀에 속하고, 게임당 가장 적은 점수를 얻은 플레이어가 C팀에 속합니다.

상자 그림은 단일 그래프에서 데이터 집합의 분포에 대한 많은 정보를 제공할 수 있기 때문에 유용합니다.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다