상자 그림을 비교하는 방법: 예 포함


상자 그림은 다음을 포함하는 데이터 세트의 5자리 요약을 표시하는 그림 유형입니다.

  • 최소값
  • 첫 번째 사분위수(25번째 백분위수)
  • 중앙값
  • 3분위수(75번째 백분위수)
  • 최대값

상자 그림을 만들기 위해 첫 번째 사분위수부터 세 번째 사분위수까지 상자를 그립니다. 다음으로 중앙값에 수직선을 그립니다. 마지막으로 사분위수의 “수염”을 최소값과 최대값까지 그립니다.

상자 그림은 데이터 세트의 값 분포를 빠르게 이해할 수 있기 때문에 유용합니다. 또한 서로 다른 두 데이터 세트를 비교하는 데에도 유용합니다.

두 개 이상의 상자 그림을 비교할 때 다음 네 가지 질문에 답할 수 있습니다.

1. 중앙값은 어떻게 비교됩니까? 각 상자의 수직선을 비교하여 어떤 데이터 세트의 중앙값이 더 높은지 확인할 수 있습니다.

2. 분산은 어떻게 비교됩니까? 각 상자의 길이(Q1과 Q3 사이의 거리(사분위수 범위)를 나타냄)를 비교하여 어떤 데이터 세트가 더 큰지 결정할 수 있습니다.

3. 비대칭성은 어떻게 비교됩니까? 수직선이 1분기에 가까울수록 데이터 세트의 양의 편향이 더 커집니다. 수직선이 3분기에 가까울수록 데이터 세트가 더 왜곡됩니다.

4. 이상값이 존재합니까? 상자 그림에서 이상값은 일반적으로 각 수염 너머로 확장되는 작은 원으로 표시됩니다. 관찰은 다음 기준 중 하나를 충족하는 경우 이상값으로 정의됩니다.

  • 하나의 관측치는 Q1 – 1.5*IQR보다 작습니다.
  • 관측치는 Q3 + 1.5*IQR보다 큽니다.

다음 예에서는 두 개의 서로 다른 상자 그림을 비교하고 이러한 네 가지 질문에 답하는 방법을 보여줍니다.

예: 상자 그림 비교

다음 데이터 세트는 시험을 준비하기 위해 두 가지 학습 기술 중 하나를 사용한 학생들의 결과를 표시합니다.

방법 1: 78, 78, 79, 80, 80, 82, 82, 83, 83, 86, 86, 86, 86, 87, 87, 87, 88, 88, 88, 91

방법 2: 66, 66, 66, 67, 68, 70, 72, 75, 75, 78, 82, 83, 86, 88, 89, 90, 93, 94, 95, 98

각 데이터 세트에 대해 상자 그림을 생성하면 다음과 같습니다.

박스 플롯 비교 예

이 두 상자 그림을 비교하고 다음 네 가지 질문에 답할 수 있습니다.

1. 중앙값은 어떻게 비교됩니까? 학습 방법 1에 대한 상자 그림 중앙의 선은 학습 방법 2에 대한 선보다 높습니다. 이는 학습 방법 1을 사용한 학생이 더 높은 시험에서 중간 성적을 받았음을 나타냅니다.

2. 분산은 어떻게 비교됩니까? 학습 방법 2의 상자 그림은 학습 방법 1의 상자 그림보다 훨씬 길며, 이는 시험 점수가 학습 방법 2를 사용한 학생들 사이에 훨씬 더 많이 분포되어 있음을 나타냅니다.

3. 비대칭성은 어떻게 비교됩니까? 학습 방법 1에 대한 상자 그림 중앙의 선은 Q3에 가깝습니다. 이는 학습 방법 1을 사용한 학생들의 시험 점수 분포가 음의 편향을 나타냅니다. 반대로, 연구 방법 2의 상자 그림 중앙에 있는 선은 상자 중앙에 가깝습니다. 이는 점수 분포가 최소한으로 치우쳐 있음을 의미합니다.

4. 이상값이 존재합니까? 두 상자 그림 모두 상단 또는 하단 수염을 넘어 확장되는 작은 원이 없습니다. 즉, 두 데이터 세트 모두 명확한 이상값이 없음을 의미합니다.

추가 리소스

Excel에서 상자 그림을 만들고 해석하는 방법
SPSS에서 상자 그림을 만들고 해석하는 방법
R에서 다중 상자 그림을 만드는 방법
Stata에서 상자 그림을 만들고 해석하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다