위치 측정

이 문서에서는 위치 측정의 정의와 용도에 대해 설명합니다. 따라서 모든 위치 측정값과 각 유형의 예를 찾을 수 있습니다.

위치 측정이란 무엇입니까?

위치는 데이터 세트를 정의하는 데 도움이 되는 측정 통계 매개변수입니다 . 간단히 말해서 위치 측정은 데이터 세트의 모양을 파악하는 데 도움이 됩니다.

통계에는 두 가지 유형의 위치 측정이 있습니다. 데이터 세트의 중심 값을 결정하는 데 사용되는 중심 위치 측정과 데이터를 동일한 간격으로 나누는 데 사용되는 비중심 위치 측정입니다 . .

위치 측정이란 무엇입니까?

통계에서 위치 측정은 다음과 같습니다.

  • 중심 위치 측정 : 분포의 중심 값을 나타냅니다.
    • 평균 : 샘플에 포함된 모든 데이터의 평균입니다.
    • 중앙값(Median) : 모든 데이터를 작은 것부터 큰 것 순으로 정렬한 중간값이다.
    • Mode : 데이터세트에서 가장 많이 반복되는 값입니다.
  • 비중심 위치 측정 : 데이터 세트를 동일한 부분으로 나눕니다.
    • 사분위수 : 데이터 샘플을 4개의 동일한 부분으로 나눕니다.
    • Quintiles : 데이터를 5개의 동일한 부분으로 나눕니다.
    • 십분위수 : 데이터 세트를 동일한 크기의 10개 간격으로 나눕니다.
    • 백분위수 : 데이터를 100개의 동등한 부분으로 나눕니다.

각 위치 측정 유형은 아래에 자세히 설명되어 있습니다.

중앙 위치 측정

중심 위치 측정은 분포의 중심 값을 나타냅니다. 즉, 데이터 세트의 중심을 나타내는 값을 찾는 데 사용됩니다. 중앙 위치에 대한 기본 측정값은 평균, 중앙값, 모드의 세 가지가 있습니다.

평균 을 계산하려면 모든 값을 더한 다음 총 관측치 수로 나눕니다. 따라서 평균의 공식은 다음과 같습니다.

\displaystyle\overline{x}=\frac{\displaystyle\sum_{i=1}^N x_i}{N}

평균은 산술 평균 또는 평균 이라고도 합니다. 또한 통계 분포의 평균은 수학적 기대값과 동일합니다.

중앙값

중앙값은 모든 데이터의 가장 작은 것부터 큰 것 순으로 정렬된 중간 값입니다. 즉, 중앙값은 정렬된 데이터 세트를 두 개의 동일한 부분으로 나눕니다.

중앙값 계산은 총 데이터 수가 짝수인지 홀수인지에 따라 달라집니다.

  • 총 데이터 수가 홀수 인 경우 중앙값은 데이터의 중앙에 있는 값이 됩니다. 즉, 정렬된 데이터의 (n+1)/2 위치에 있는 값을 말합니다.
  • Me=x_{\frac{n+1}{2}

  • 총 데이터 포인트 수가 짝수 인 경우 중앙값은 중앙에 위치한 두 데이터 포인트의 평균이 됩니다. 즉, 정렬된 데이터의 n/2 위치와 n/2+1 위치에 있는 값의 산술 평균입니다.
  • Me=\cfrac{x_{\frac{n}{2}}+x_{\frac{n}{2}+1}}{2}

n

는 표본의 총 데이터 수이고 Me 는 중앙값입니다.

패션

통계에서 최빈값 은 데이터 집합에서 절대빈도가 가장 높은 값, 즉 데이터 집합에서 가장 많이 나타나는 값을 말합니다.

따라서 통계 데이터 세트의 모드를 계산하려면 각 데이터 항목이 샘플에 나타나는 횟수를 세면 가장 많이 반복되는 데이터 항목이 모드가 됩니다.

모드는 통계 모드 또는 모드 값 이라고도 할 수 있습니다.

가장 많이 반복되는 값의 수에 따라 세 가지 유형의 모드를 구분할 수 있습니다.

  • 유니모달 모드 : 최대 반복 횟수를 갖는 값이 하나만 있습니다. 예를 들어 [1, 4, 2, 4, 5, 3]입니다.
  • 바이모달 모드 : 서로 다른 두 값에서 최대 반복 횟수가 발생하며 두 값 모두 동일한 횟수만큼 반복됩니다. 예를 들어 [2, 6, 7, 2, 3, 6, 9]입니다.
  • 멀티모달 모드 : 3개 이상의 값이 동일한 최대 반복 횟수를 갖습니다. 예를 들어 [3, 3, 4, 1, 3, 4, 2, 1, 4, 5, 2, 1]입니다.

비중심 위치 측정

비중심 위치 측정은 통계 데이터 세트를 동일한 간격으로 나누는 데 사용됩니다. 비중심 위치 측정값에는 주로 사분위수, 오분위수, 십분위수, 백분위수의 네 가지 유형이 있습니다.

사분위수

통계에서 사분위수는 데이터 세트를 4개의 동일한 부분으로 나누는 세 가지 값입니다. 따라서 첫 번째, 두 번째, 세 번째 사분위수는 각각 전체 통계 데이터의 25%, 50%, 75%를 나타냅니다.

사분위수는 대문자 Q와 사분위수 지수로 표시되므로 첫 번째 사분위수는 Q 1 , 두 번째 사분위수는 Q 2 , 세 번째 사분위수는 Q 3 입니다.

5분위수

5분위수는 정렬된 데이터 세트를 5개의 동일한 부분으로 나누는 4개의 값입니다. 따라서 첫 번째, 두 번째, 세 번째 및 네 번째 5분위수는 각각 표본 데이터의 20%, 40%, 60% 및 80%를 나타냅니다.

예를 들어, 세 번째 5분위수는 수집된 전체 데이터의 60% 이상을 나타내지만 나머지 데이터보다는 작습니다.

5분위수 기호는 5분위수 지수가 있는 대문자 K입니다. 즉, 첫 번째 5분위수는 K 1 , 두 번째 5분위수는 K 2 , 세 번째 5분위수는 K 3 , 네 번째 5분위수는 K 4 입니다. 문자 Q로 표시할 수도 있지만(4분위수와 혼동을 일으키므로 권장되지 않음)

십분위수

십분위수는 정렬된 데이터 집합을 10개의 동일한 부분으로 나누는 9개의 값입니다. 따라서 첫 번째, 두 번째, 세 번째,… 십분위는 표본 또는 모집단의 10%, 20%, 30%,…를 나타냅니다.

예를 들어, 네 번째 십분위수 값은 데이터의 40%보다 높지만 나머지 데이터보다 낮습니다.

일반적으로 십분위수는 대문자 D와 십분위수 지수로 표시되는데, 즉 첫 번째 십분위수는 D 1 , 두 번째 십분위수는 D2 , 세 번째 십분위수는 D3 등이 됩니다.

백분위수

백분위수는 정렬된 데이터 집합을 100개의 동일한 부분으로 나누는 값입니다. 따라서 백분위수는 데이터 세트의 백분율이 그 이하로 떨어지는 값을 나타냅니다.

예를 들어, 35번째 백분위수 값은 관측된 데이터의 35%보다 높지만 나머지 데이터보다 낮습니다.

백분위수는 대문자 P와 백분위수 지수로 표시됩니다. 즉, 첫 번째 백분위수는 P 1 , 40번째 백분위수는 P 40 , 79번째 백분위수는 P 79 등입니다.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다