통계 공식

여기에서 주요 통계 공식을 찾을 수 있습니다. 또한 각 통계 공식의 적용 예를 볼 수 있는 기사 링크를 남겨두었습니다. 또한 계산을 수행할 필요 없이 공식 결과를 직접 알 수 있도록 온라인 계산기를 사용할 수도 있습니다.

중심 경향의 통계적 측정을 위한 공식

평균 을 계산하려면 모든 값을 더한 다음 전체 데이터 수로 나눕니다. 따라서 평균의 공식은 다음과 같습니다.

\displaystyle\overline{x}=\frac{\displaystyle\sum_{i=1}^n x_i}{n}

통계에서 평균은 산술 평균 또는 평균 이라고도 합니다.

중앙값

중앙값은 모든 데이터의 가장 작은 것부터 큰 것 순으로 정렬된 중간 값입니다. 즉, 중앙값은 정렬된 데이터 세트를 두 개의 동일한 부분으로 나눕니다.

중앙값 계산은 총 데이터 수가 짝수인지 홀수인지에 따라 달라집니다.

  • 총 데이터 수가 홀수 인 경우 중앙값은 데이터의 중앙에 있는 값이 됩니다. 즉, 정렬된 데이터의 (n+1)/2 위치에 있는 값을 말합니다.
  • Me=x_{\frac{n+1}{2}

  • 총 데이터 포인트 수가 짝수 인 경우 중앙값은 중앙에 위치한 두 데이터 포인트의 평균이 됩니다. 즉, 정렬된 데이터의 n/2 위치와 n/2+1 위치에 있는 값의 산술 평균입니다.
  • Me=\cfrac{x_{\frac{n}{2}}+x_{\frac{n}{2}+1}}{2}

n

는 표본의 총 데이터 수이고 기호 Me는 중앙값을 나타냅니다.

참고: 중앙값 계산기

패션

통계에서 모드는 데이터 세트에서 절대 빈도가 가장 높은 값, 즉 데이터 세트에서 가장 많이 반복되는 값을 의미합니다.

따라서 모드에 대한 특별한 공식은 없지만, 통계 데이터 세트의 모드를 계산하려면 간단히 각 데이터 요소가 샘플에 나타나는 횟수를 세면 가장 많이 반복되는 데이터가 모드가 됩니다.

모드는 통계 모드 또는 모드 값 이라고도 할 수 있습니다.

참고: 패션 계산기

분산의 통계적 측정을 위한 공식

표준 편차

표준편차라고도 하는 표준편차는 데이터 계열의 편차 제곱합을 총 관측치 수로 나눈 값의 제곱근과 같습니다.

따라서 표준편차의 공식은 다음과 같습니다.

\displaystyle\sigma=\sqrt{\frac{\displaystyle\sum_{i=1}^n(x_i-\overline{x})^2}{n}}

변화

분산은 총 관측치 수에 대한 잔차 제곱의 합과 같습니다. 따라서 이 통계 측정항목의 공식은 다음과 같습니다.

Var(X)=\cfrac{\displaystyle\sum_{i=1}^n\left(x_i-\overline{x}\right)^2}{n}

금:

  • X

    분산을 계산하려는 확률 변수입니다.

  • x_i

    데이터 값입니다

    i

    .

  • n

    총 관측치 수입니다.

  • \overline{X}

    확률변수의 평균이다

    X

    .

참고: 간격 계산기

변동 계수

통계에서 변동 계수는 평균을 기준으로 데이터 세트의 분산을 결정하는 데 사용되는 분산 척도입니다. 변동계수는 데이터의 표준편차를 평균으로 나눈 후 100을 곱하여 백분율로 표시하는 방식으로 계산됩니다.

CV=\cfrac{\sigma}{\overline{x}}\cdot 100

정돈하다

통계 범위 는 표본에 있는 데이터의 최대값과 최소값 간의 차이를 나타내는 분산 측정값입니다. 따라서 모집단이나 통계 표본의 범위를 계산하려면 최소값에서 최대값을 빼야 합니다.

R=\text{M\'ax}-\text{M\'in}

사분위수 범위

사분위간 범위 라고도 불리는 사분위간 범위는 세 번째 사분위수와 첫 번째 사분위수 간의 차이를 나타내는 통계적 분산의 척도입니다.

따라서 통계 데이터 세트의 사분위수 범위를 계산하려면 먼저 세 번째와 첫 번째 사분위수를 구한 다음 이를 빼야 합니다.

IQR=Q_3-Q_1

중간 차이

평균 절대 편차 라고도 하는 평균 편차 는 절대 편차의 평균입니다. 따라서 평균 편차는 산술 평균과 각 데이터 항목의 편차의 합을 총 데이터 항목 수로 나눈 값과 같습니다.

D_{\overline{x}}=\cfrac{\sum_{i=1}^n|x_i-\overline{x}|}{n}

통계적 위치 측정 공식

사분위수

통계에서 사분위수는 정렬된 데이터 집합을 4개의 동일한 부분으로 나누는 세 가지 값입니다. 따라서 첫 번째, 두 번째, 세 번째 사분위수는 각각 전체 통계 데이터의 25%, 50%, 75%를 나타냅니다.

사분위수는 대문자 Q와 사분위수 지수로 표시되므로 첫 번째 사분위수는 Q 1 , 두 번째 사분위수는 Q 2 , 세 번째 사분위수는 Q 3 입니다.

사분위수 공식은 다음과 같습니다.

\cfrac{k\cdot (n+1)}{4} \qquad k=1, 2, 3

참고: 이 공식은 사분위수 값이 아닌 사분위수 위치를 알려줍니다. 사분위수는 공식으로 얻은 위치에 있는 데이터입니다.

그러나 때로는 이 공식의 결과가 십진수를 제공할 수도 있습니다. 따라서 결과가 십진수인지 아닌지에 따라 두 가지 경우를 구별해야 합니다.

  • 수식의 결과가 소수 부분이 없는 숫자 인 경우 사분위수는 위 수식에서 제공하는 위치에 있는 데이터입니다.
  • 수식 결과가 소수 부분이 있는 숫자 인 경우 사분위수 값은 다음 수식을 사용하여 계산됩니다.

Q=x_i+d\cdot (x_{i+1}-x_i)

여기서 x ix i+1 은 첫 번째 수식에서 구한 숫자가 위치한 위치의 숫자이고, d 는 첫 번째 수식에서 구한 숫자의 소수 부분입니다.

십분위수

통계에서 십분위수는 정렬된 데이터 집합을 10개의 동일한 부분으로 나누는 9개의 값입니다. 따라서 첫 번째, 두 번째, 세 번째,… 십분위는 표본 또는 모집단의 10%, 20%, 30%,…를 나타냅니다.

십분위수는 대문자 D와 십분위수 지수로 표시됩니다. 즉, 첫 번째 십분위수는 D 1 , 두 번째 십분위수는 D 2 , 세 번째 십분위수는 D3 등입니다.

십분위수 공식은 다음과 같습니다.

\cfrac{k\cdot (n+1)}{10} \qquad k=1, 2, 3,4,5,6,7,8,9

참고: 이 공식은 십분위수 값이 아니라 십분위수 위치를 알려줍니다. 십분위수는 공식에 의해 구해진 위치에 위치한 데이터가 됩니다.

그러나 때로는 이 공식의 결과가 십진수를 제공하므로 결과가 십진수인지 아닌지에 따라 두 가지 경우를 구별해야 합니다.

  • 수식의 결과가 소수점 이하의 숫자 인 경우 십분위수는 위 수식에서 제공하는 위치에 위치한 데이터가 됩니다.
  • 공식의 결과가 소수 부분을 포함하는 숫자 인 경우 십분위수 값은 다음 공식을 사용하여 계산됩니다.

D=x_i+d\cdot (x_{i+1}-x_i)

여기서 x ix i+1 은 첫 번째 수식에서 구한 숫자가 위치한 위치의 숫자이고, d 는 첫 번째 수식에서 구한 숫자의 소수 부분입니다.

백분위수

통계에서 백분위수는 정렬된 데이터 집합을 100개의 동일한 부분으로 나누는 값입니다. 따라서 백분위수는 데이터 세트의 백분율이 그 이하로 떨어지는 값을 나타냅니다.

백분위수는 대문자 P와 백분위수 지수로 표시됩니다. 즉, 첫 번째 백분위수는 P 1 , 40번째 백분위수는 P 40 , 79번째 백분위수는 P 79 등입니다.

백분위수 공식은 다음과 같습니다.

\cfrac{k\cdot (n+1)}{100} \qquad k=1, 2, 3,\ldots ,97,98,99

참고: 이 공식은 백분위수의 위치를 알려주지만 그 값은 알려주지 않습니다. 백분위수는 공식에 의해 구해진 위치에 있는 데이터가 됩니다.

그러나 때로는 이 공식의 결과가 십진수를 제공하므로 결과가 십진수인지 아닌지에 따라 두 가지 경우를 구별해야 합니다.

  • 수식의 결과가 소수 부분이 없는 숫자 인 경우 백분위수는 위 수식에서 제공하는 위치에 있는 데이터에 해당합니다.
  • 수식 결과가 소수 부분이 포함된 숫자 인 경우 정확한 백분위수 값은 다음 수식을 사용하여 계산됩니다.

P=x_i+d\cdot (x_{i+1}-x_i)

여기서 x ix i+1 은 첫 번째 수식에서 구한 숫자가 위치한 위치의 숫자이고, d 는 첫 번째 수식에서 구한 숫자의 소수 부분입니다.

통계적 형상 측정 공식

비대칭 계수

왜도 계수 또는 왜도 지수는 분포의 왜도를 결정하는 데 사용되는 통계 계수입니다. 따라서 비대칭 계수를 계산하면 분포를 그래픽으로 표현하지 않고도 분포의 비대칭 유형을 알 수 있습니다.

비대칭 계수의 공식은 다음과 같습니다.

\displaystyle\gamma_1=\frac{\overline{x}_3}{\sigma^3}

마찬가지로 다음 두 공식 중 하나를 사용하여 Fisher 비대칭 계수를 계산할 수 있습니다.

\displaystyle\gamma_1=\frac{\displaystyle \sum_{i=1}^N\left(x_i-\overline{x}\right)^3}{n\cdot \sigma ^3}

\displaystyle\gamma_1=\frac{\operatorname{E}[X^3] - 3\cdot \overline{x}\cdot \sigma^2 - \overline{x}^3}{\sigma^3}

E

수학적 기대값입니다.

\overline{x}

산술 평균,

\sigma

표준편차

n

총 데이터 수입니다.

참조: 비대칭 계수

첨도 계수

선명도라고도 하는 첨도는 분포가 평균 주위에 얼마나 집중되어 있는지를 나타냅니다. 즉, 첨도는 분포가 가파른지 평평한지 여부를 나타냅니다. 특히, 분포의 첨도가 클수록 분포의 기울기가 더 가파르거나 뾰족해집니다.

첨도 계수의 공식은 다음과 같습니다.

\displaystyle g_2=\frac{1}{n}\cdot\frac{\displaystyle \sum_{i=1}^n(x_i-\overline{x})^4}{\sigma^4}-3

x_i

관찰에 해당하는 값입니다.

i

,

\overline{x}

산술 평균,

\sigma

표준편차

n

총 데이터 수입니다.

모든 통계식의 요약표

마지막으로 주요 통계 공식을 요약한 표를 남겨드립니다.

통계 공식
참고: 확률 공식

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다