사분위수 범위와 표준편차: 차이점은 무엇인가요?
사분위수 범위 와 표준 편차는 데이터 세트의 값 분포를 측정하는 두 가지 방법입니다.
이 튜토리얼에서는 두 측정항목 간의 유사점과 차이점과 함께 각 측정항목에 대한 간략한 설명을 제공합니다.
사분위수 범위
데이터 세트의 사 분위수 범위 (IQR)는 첫 번째 사분위수(25번째 백분위수)와 세 번째 사분위수(75번째 백분위수)의 차이입니다. 평균 50% 값의 분포를 측정합니다.
IQR = 3분기 – 1분기
예를 들어 다음과 같은 데이터 세트가 있다고 가정해 보겠습니다.
데이터세트: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32
사분위간 범위 계산기에 따르면 이 데이터세트의 사분위간 범위(IQR)는 다음과 같이 계산됩니다.
- T1: 12
- T3: 26.5
- IQR = Q3 – Q1 = 14.5
이는 데이터세트 값의 중간 50%에 14.5 의 편차가 있음을 알려줍니다.
표준 편차
데이터 세트의 표준 편차는 평균값과 개별 값의 일반적인 편차를 측정하는 방법입니다. 다음과 같이 계산됩니다.
s = √(Σ(x i – x ) 2 / (n-1))
예를 들어 다음과 같은 데이터 세트가 있다고 가정해 보겠습니다.
데이터세트: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32
계산기를 사용하여 이 데이터 세트의 표준편차가 9.25 임을 알 수 있습니다. 이를 통해 일반적인 값이 평균에서 얼마나 떨어져 있는지 알 수 있습니다.
유사점과 차이점
사분위수 범위와 표준편차는 다음과 같은 유사성을 공유합니다.
- 두 측정항목 모두 데이터 세트의 값 분포를 측정합니다.
그러나 사분위간 범위와 표준 편차 에는 다음과 같은 주요 차이점이 있습니다.
- IQR(사분위간 범위)은 극단적인 특이치의 영향을 받지 않습니다. 예를 들어, IQR은 데이터세트의 25번째 백분위수와 75번째 백분위수 값만 사용하므로 데이터세트의 매우 작거나 큰 값은 IQR 계산에 영향을 주지 않습니다.
- 표준편차는 극단적인 특이치의 영향을 받습니다 . 예를 들어, 데이터 세트의 값이 매우 크면 표준 편차가 공식에서 데이터 세트의 모든 값을 사용하므로 훨씬 더 큰 표준 편차가 발생합니다.
각각을 사용하는 경우
극단적인 이상값이 있는 경우 데이터 세트의 값 분포를 측정하려면 사분위수 범위를 사용해야 합니다.
반대로, 극단적인 이상값이 없을 때 값의 분포를 측정하려면 표준편차를 사용해야 합니다.
이유를 설명하려면 다음 데이터세트를 고려하세요.
데이터세트: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32
기사 앞부분에서 이 데이터 세트에 대해 다음 측정항목을 계산했습니다.
- IQR: 14.5
- 표준편차: 9.25
그러나 데이터 세트에 극단적인 특이치가 있는 경우를 고려하십시오.
데이터세트: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32, 378
계산기를 사용하여 이 데이터세트에 대한 다음 측정항목을 찾을 수 있습니다.
- IQR: 15
- 표준편차: 85.02
특이치가 존재할 때 사분위간 범위는 거의 변하지 않는 반면, 표준 편차는 9.25에서 85.02로 증가합니다.
추가 리소스
중심 경향 측정: 정의 및 예
분산 측정: 정의 및 예
사분위수 범위를 사용하여 이상값을 찾는 방법