중앙값

이 문서에서는 데이터 세트의 중앙값이 무엇인지, 그룹화되지 않은 데이터와 그룹화된 데이터의 중앙값을 찾는 방법을 설명합니다. 또한 마지막에 있는 온라인 계산기를 사용하여 모든 데이터 계열의 중앙값을 계산할 수 있습니다.

중앙값은 무엇입니까?

통계에서 중앙값은 모든 데이터를 가장 작은 것부터 큰 것 순으로 정렬한 중간 값입니다. 즉, 중앙값은 정렬된 데이터 세트를 두 개의 동일한 부분으로 나눕니다.

중앙값은 확률 분포를 설명하는 데 사용되는 중앙 위치의 척도입니다.

중앙값

👉 아래 계산기를 사용하여 모든 데이터 세트의 중앙값을 계산할 수 있습니다.

일반적으로 자아라는 용어는 중간의 상징으로 자주 사용됩니다.

다른 중앙 위치 측정값은 평균과 최빈값입니다. 아래에서 이들 간의 차이점을 살펴보겠습니다. 마찬가지로, 비중심 위치의 측정값은 사분위수, 오분위수, 십분위수, 백분위수 등입니다.

데이터 세트의 중앙값은 2분위수, 5분위수, 50번째 백분위수와 일치한다는 점에 유의해야 합니다.

중앙값을 계산하는 방법

중앙값 계산은 총 데이터 수가 짝수인지 홀수인지에 따라 달라집니다.

  • 총 데이터 수가 홀수 인 경우 중앙값은 데이터의 중앙에 있는 값이 됩니다. 즉, 정렬된 데이터의 (n+1)/2 위치에 있는 값을 말합니다.
  • Me=x_{\frac{n+1}{2}

  • 총 데이터 포인트 수가 짝수 인 경우 중앙값은 중앙에 위치한 두 데이터 포인트의 평균이 됩니다. 즉, 정렬된 데이터의 n/2 위치와 n/2+1 위치에 있는 값의 산술 평균 입니다.
  • Me=\cfrac{x_{\frac{n}{2}}+x_{\frac{n}{2}+1}}{2}

n

표본에 있는 데이터 항목의 총 개수입니다.

중앙값 계산의 예

중앙값이 어떻게 계산되는지 확인할 수 있도록 아래에는 각 사례에 하나씩 두 가지 실제 사례가 나와 있습니다. 먼저 홀수 데이터 세트의 중앙값을 계산한 다음 짝수 데이터 세트의 중앙값을 계산합니다.

홀수 데이터의 중앙값

  • 다음 데이터의 중앙값을 계산합니다: 3, 4, 1, 6, 7, 4, 8, 2, 8, 4, 5

계산을 수행하기 전에 가장 먼저 해야 할 일은 데이터의 순서를 지정하는 것입니다. 즉, 숫자를 가장 작은 것부터 큰 것 순으로 나열합니다.

1 \ 2 \ 3 \ 4 \ 4 \ 4 \ 5 \ 6 \ 7 \ 8 \ 8

이 경우에는 11개의 관측치가 있으므로 총 데이터 수는 홀수입니다. 따라서 중앙값의 위치를 계산하기 위해 다음 공식을 적용합니다.

\cfrac{n+1}{2}=\cfrac{11+1}{2}=6

따라서 중앙값은 6번째 위치에 있는 데이터가 되며, 이 경우 값 4에 해당합니다.

Me=x_6=4

짝수 데이터의 중앙값

  • 다음 관측치의 중앙값은 얼마입니까? 2장, 6장, 2장, 8장, 9장, 4장, 7장, 11장, 4장, 13장

중앙값을 얻으려면 먼저 모든 데이터를 오름차순으로 정렬해야 합니다.

2 \ 2 \ 4 \ 4 \ 6 \ 7 \ 8 \ 9 \ 11 \ 13

이 예는 이전 예와 다릅니다. 이번에는 짝수인 총 10개의 관측치가 있기 때문입니다. 따라서 평균을 결정하는 절차는 조금 더 복잡합니다.

먼저 중앙값을 찾을 수 있는 두 개의 중앙 위치를 계산해야 합니다. 이를 위해서는 다음 두 공식을 적용해야 합니다.

\cfrac{n}{2}=\cfrac{10}{2}=5

\cfrac{n}{2}+1=\cfrac{10}{2}+1=6

따라서 중앙값은 값 6과 7에 각각 해당하는 5번째와 6번째 위치 사이에 있게 됩니다. 구체적으로 중앙값은 해당 값의 산술 평균이 됩니다.

Me=\cfrac{x_5+x_6}{2}=\cfrac{6+7}{2}=6,5

중앙값 계산기

중앙값을 계산하려면 다음 계산기에 통계 데이터 세트를 입력하세요. 데이터는 공백으로 구분해야 하며 소수점 구분 기호로 마침표를 사용하여 입력해야 합니다.

그룹화된 데이터의 중앙값

데이터가 구간으로 그룹화될 때 중앙값을 계산 하려면 먼저 다음 공식을 사용하여 중앙값이 속하는 구간 또는 구간을 찾아야 합니다.

\cfrac{n+1}{2}

따라서 중앙값은 이전 대수식으로 얻은 숫자보다 누적 절대 빈도가 즉시 더 큰 구간에 있게 됩니다.

그리고 중앙값이 속하는 간격을 알고 나면 다음 공식을 적용하여 중앙값의 정확한 값을 찾아야 합니다.

Me=L_i+ \cfrac{\displaystyle\frac{n+1}{2}-F_{i-1}}{f_i}\cdot I_i

금:

  • Li 중앙값이 있는 구간의 하한입니다.
  • n 은 총 관측치 수입니다.
  • Fi -1 은 이전 간격의 누적 절대 빈도입니다.
  • f i 는 중앙값이 있는 구간의 절대 빈도입니다.
  • I i 중간 간격의 너비입니다.

예를 들어, 아래에서는 간격으로 그룹화된 데이터의 중앙값을 계산하는 연습 문제를 해결했습니다.

풀링된 데이터의 중앙값

데이터 세트의 중앙값을 찾으려면 먼저 데이터 세트가 속하는 범위를 결정해야 합니다. 이를 위해 다음 공식을 사용합니다.

\cfrac{n+1}{2}=\cfrac{30+1}{2} =15,5 \quad \color{orange}\bm{\longrightarrow}\color{black}\quad [60,70)

따라서 중앙값은 누적 절대 빈도가 15.5보다 바로 큰 구간에 있게 됩니다. 이 경우에는 누적 절대 빈도가 26인 구간 [60.70)입니다. 그리고 중앙값 구간을 알고 나면 다음 식의 두 번째 공식을 적용합니다. 프로세스:

Me=L_i+ \cfrac{\displaystyle\frac{n+1}{2}-F_{i-1}}{f_i}\cdot I_i

Me=60+\cfrac{\displaystyle\frac{30+1}{2}-15}{11}\cdot 10=60,45

궁극적으로 풀링된 데이터 세트의 중앙값은 60.45입니다. 보시다시피, 이러한 유형의 문제에서 중앙값은 일반적으로 십진수입니다.

중앙값, 평균 및 최빈값

이 마지막 섹션에서는 중앙값, 평균 및 최빈값의 차이점이 무엇인지 살펴보겠습니다. 음, 이것들은 중심 위치에 대한 세 가지 통계적 척도이지만 그 의미는 다릅니다.

앞서 살펴보았듯이 중앙값은 데이터를 정렬할 때 중심 위치를 차지하는 값으로 정의됩니다.

반면, 평균은 모든 통계 데이터의 평균값입니다. 평균을 계산하려면 모든 데이터를 더한 다음 결과를 데이터 포인트 수로 나누어야 합니다.

마지막으로 모드는 데이터 계열에서 가장 많이 반복되는 값입니다.

보시다시피 세 가지 통계 측정값은 모두 확률 분포의 중심 값에 대한 아이디어를 제공하므로 확률 분포를 설명하는 데 도움이 됩니다. 그러나 어떤 측정도 다른 측정보다 낫지 않으며 단순히 다른 개념을 나타냅니다.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다