形状測定

この記事では形状測定とは何かについて説明します。したがって、形状メトリックが何に使用されるか、形状メトリックがどのように解釈されるか、およびこれらのタイプの統計メトリックがどのように計算されるかを学びます。

形状測定とは何ですか?

統計学において、形状測定は、確率分布をその形状に従って説明できるようにする指標です。つまり、形状メジャーは、分布をグラフ化することなく、分布がどのように見えるかを決定するために使用されます。

形状測定には、歪度と尖度の 2 種類があります。歪度は分布がどの程度対称的であるかを示し、尖度は分布が平均の周囲にどの程度集中しているかを示します。

形状測定値とは何ですか?

このセクションでは、形状尺度の定義を考慮して、これらのタイプの統計パラメーターが何であるかを示します。

統計では、次の 2 つの形式の尺度を区別します。

  • 歪度: 分布が対称か非対称かを示します。
  • 尖度– 分布が急峻であるか平坦であるかを示します。

非対称

非対称には 3 つのタイプがあります。

  • 正の非対称性: 分布には、平均の左側より右側の方が異なる値が多くあります。
  • 対称性: 分布には、平均の左側と右側の値の数が同じになります。
  • 負の歪度: 分布には、平均の右側よりも左側の方が異なる値が多くあります。
非対称の種類

非対称係数

歪度係数、または非対称指数 は、分布の非対称性を判断するのに役立つ統計係数です。したがって、非対称係数を計算することにより、分布をグラフ化することなく、分布の非対称性の種類を知ることができます。

非対称係数を計算するにはさまざまな式があり、それらをすべて以下に示しますが、使用する式に関係なく、非対称係数の解釈は常に次のように行われます。

  • 歪度係数が正の場合、分布は正に歪んでいます。
  • 歪度係数がゼロの場合、分布は対称です。
  • 歪度係数が負の場合、分布は負に歪んでいます。
フィッシャーの非対称係数

フィッシャーの歪度係数は、平均値をサンプル標準偏差で割った値に関する 3 次モーメントに等しくなります。したがって、フィッシャーの非対称係数の式は次のようになります。

\displaystyle\gamma_1=\frac{\mu_3}{\sigma^3}

同様に、次の 2 つの式のいずれかを使用してフィッシャー係数を計算できます。

\displaystyle\gamma_1=\frac{\displaystyle \sum_{i=1}^N\left(x_i-\mu\right)^3}{N\cdot \sigma ^3}

\displaystyle\gamma_1=\frac{\operatorname{E}[X^3] - 3\mu\sigma^2 - \mu^3}{\sigma^3}

E

は数学的な期待値であり、

\mu

算術平均、

\sigma

標準偏差と

N

データの総数。

一方、データがグループ化されている場合は、次の式を使用できます。

\displaystyle\gamma_1=\frac{\displaystyle \sum_{i=1}^N\left(x_i-\mu\right)^3\cdot f_i}{N\cdot \sigma ^3}

この場合どこに

x_i

それはクラスの証であり、

f_i

コースの絶対頻度。

ピアソンの非対称係数

ピアソンの歪度係数は、サンプル平均と最頻値の差を標準偏差 (または標準偏差) で割ったものに等しくなります。したがって、ピアソンの非対称係数の式は次のようになります。

A_p=\cfrac{\mu-Mo}{\sigma}

A_p

はピアソン係数、

\mu

算術平均、

Mo

ファッションと

\sigma

標準偏差。

ピアソン歪度係数は、単峰分布の場合、つまりデータ内にモードが 1 つだけ存在する場合にのみ計算できることに注意してください。

ボウリーの非対称係数

ボウリーの歪度係数は、第 3 四分位数と第 1 四分位数の合計から中央値の 2 倍を引いた値を、第 3 四分位数と第 1 四分位数の差で割ったものに等しくなります。したがって、この非対称係数の式は次のようになります。

A_B=\cfrac{Q_3+Q_1-2\cdot Me}{Q_3-Q_1}

Q_1

そして

Q_3

はそれぞれ第 1 四分位数と第 3 四分位数であり、

Me

分布の中央値です。

平坦化

尖度 は歪度とも呼ばれ、分布が平均値付近にどの程度集中しているかを示します。言い換えれば、尖度は分布が急峻であるか平坦であるかを示します。具体的には、分布の尖度が大きいほど、分布は急峻になります (または鋭くなります)。

お世辞

お世辞には 3 つのタイプがあります。

  • Leptocurtic : 分布は非常に尖っています。つまり、データは平均値の周囲に強く集中しています。より正確には、レプトクルティック分布は、正規分布よりもシャープな分布として定義されます。
  • メソクルティック: 分布の尖度は正規分布の尖度に相当します。したがって、尖っていても平坦でもないと考えられます。
  • Platicurtic : 分布は非常に平坦です。つまり、平均付近の濃度が低いことを意味します。正式には、板状分布は正規分布より平坦な分布として定義されます。

さまざまなタイプの尖度は、正規分布の尖度を基準として定義されることに注意してください。

お世辞の種類

平坦化係数

尖度係数の式は次のとおりです。

\displaystyle g_2=\frac{1}{N}\cdot\frac{\displaystyle \sum_{i=1}^N(x_i-\mu)^4}{\sigma^4}-3

度数表にグループ化されたデータの尖度係数の式は次のとおりです。

\displaystyle g_2=\frac{1}{N}\cdot\frac{\displaystyle \sum_{i=1}^N f_i\cdot(x_i-\mu)^4}{\sigma^4}-3

最後に、間隔にグループ化されたデータの尖度係数の式は次のとおりです。

\displaystyle g_2=\frac{1}{N}\cdot\frac{\displaystyle \sum_{i=1}^N f_i\cdot(c_i-\mu)^4}{\sigma^4}-3

金:

  • g_2

    尖度係数です。

  • N

    はデータの総数です。

  • x_i

    はシリーズの i 番目のデータです。

  • \mu

    は分布の算術平均です。

  • \sigma

    分布の標準偏差 (または典型偏差) です。

  • f_i

    は、データセットの絶対周波数です。

  • c_i

    は i 番目のグループのクラスマークです。

すべての尖度係数の式では、正規分布の尖度値であるため 3 が減算されることに注意してください。したがって、尖度係数の計算は、正規分布の尖度を基準として行われます。このため、統計では過剰な尖度が計算されると言われることがあります。

尖度係数が計算されたら、次のように解釈して尖度のタイプを特定する必要があります。

  • 尖度係数が正の場合、分布がレプトクであることを意味します。
  • 尖度係数が 0 の場合、分布がメソクルティックであることを意味します。
  • 尖度係数が負の場合、分布が平坦であることを意味します。

他の種類の統計的尺度

次の統計指標のいずれかにも興味があるかもしれません。いずれかをクリックして、その内容とその計算方法を確認してください。

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です