사분위수 범위와 표준편차: 차이점은 무엇인가요?


사분위수 범위표준 편차는 데이터 세트의 값 분포를 측정하는 두 가지 방법입니다.

이 튜토리얼에서는 두 측정항목 간의 유사점과 차이점과 함께 각 측정항목에 대한 간략한 설명을 제공합니다.

사분위수 범위

데이터 세트의 사 분위수 범위 (IQR)는 첫 번째 사분위수(25번째 백분위수)와 세 번째 사분위수(75번째 백분위수)의 차이입니다. 평균 50% 값의 분포를 측정합니다.

IQR = 3분기 – 1분기

예를 들어 다음과 같은 데이터 세트가 있다고 가정해 보겠습니다.

데이터세트: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32

사분위간 범위 계산기에 따르면 이 데이터세트의 사분위간 범위(IQR)는 다음과 같이 계산됩니다.

  • T1: 12
  • T3: 26.5
  • IQR = Q3 – Q1 = 14.5

이는 데이터세트 값의 중간 50%에 14.5 의 편차가 있음을 알려줍니다.

표준 편차

데이터 세트의 표준 편차는 평균값과 개별 값의 일반적인 편차를 측정하는 방법입니다. 다음과 같이 계산됩니다.

s = √(Σ(x ix ) 2 / (n-1))

예를 들어 다음과 같은 데이터 세트가 있다고 가정해 보겠습니다.

데이터세트: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32

계산기를 사용하여 이 데이터 세트의 표준편차가 9.25 임을 알 수 있습니다. 이를 통해 일반적인 값이 평균에서 얼마나 떨어져 있는지 알 수 있습니다.

유사점과 차이점

사분위수 범위와 표준편차는 다음과 같은 유사성을 공유합니다.

  • 두 측정항목 모두 데이터 세트의 값 분포를 측정합니다.

그러나 사분위간 범위와 표준 편차 에는 다음과 같은 주요 차이점이 있습니다.

  • IQR(사분위간 범위)은 극단적인 특이치의 영향을 받지 않습니다. 예를 들어, IQR은 데이터세트의 25번째 백분위수와 75번째 백분위수 값만 사용하므로 데이터세트의 매우 작거나 큰 값은 IQR 계산에 영향을 주지 않습니다.
  • 표준편차는 극단적인 특이치의 영향을 받습니다 . 예를 들어, 데이터 세트의 값이 매우 크면 표준 편차가 공식에서 데이터 세트의 모든 값을 사용하므로 훨씬 더 큰 표준 편차가 발생합니다.

각각을 사용하는 경우

극단적인 이상값이 있는 경우 데이터 세트의 값 분포를 측정하려면 사분위수 범위를 사용해야 합니다.

반대로, 극단적인 이상값이 없을 때 값의 분포를 측정하려면 표준편차를 사용해야 합니다.

이유를 설명하려면 다음 데이터세트를 고려하세요.

데이터세트: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32

기사 앞부분에서 이 데이터 세트에 대해 다음 측정항목을 계산했습니다.

  • IQR: 14.5
  • 표준편차: 9.25

그러나 데이터 세트에 극단적인 특이치가 있는 경우를 고려하십시오.

데이터세트: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32, 378

계산기를 사용하여 이 데이터세트에 대한 다음 측정항목을 찾을 수 있습니다.

  • IQR: 15
  • 표준편차: 85.02

특이치가 존재할 때 사분위간 범위는 거의 변하지 않는 반면, 표준 편차는 9.25에서 85.02로 증가합니다.

추가 리소스

중심 경향 측정: 정의 및 예
분산 측정: 정의 및 예
사분위수 범위를 사용하여 이상값을 찾는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다