非対称性と平坦化

この記事では、統計における歪度と尖度について説明します。したがって、これら 2 つの概念の定義、歪みと尖度の計算方法、その公式、および任意のデータ サンプルの歪みと尖度を計算するためのオンライン計算機を見つけることができます。

歪度と尖度とは何ですか?

歪度と尖度は、グラフを作成せずに分布の形状を説明するために使用される 2 つの統計的尺度です。より具体的には、歪度は分布の対称性 (または歪度) の度合いを示し、尖度は平均付近の分布の集中度を示します。

統計学では、歪度と尖度は形状測定とも呼ばれます。

👉以下のオンライン計算ツールを使用して、任意のデータセットの歪度と尖度を計算できます。

非対称

統計において、歪度は、平均に対する分布の対称性 (または非対称性) の度合いを示す尺度です。簡単に言うと、歪度は、グラフで表現することなく、分布の対称性 (または非対称性) の度合いを決定するために使用される統計パラメータです。

したがって、非対称分布とは、平均値の右側の値と左側の値の数が異なる分布のことです。一方、対称分布では、平均値の左右に同じ数の値があります。

したがって、次の 3 つのタイプの非対称性を区別します。

  • 正の非対称性: 分布には、平均の左側より右側の方が異なる値が多くあります。
  • 対称性: 分布には、平均の左側と右側の値の数が同じになります。
  • 負の歪度: 分布には、平均の右側よりも左側の方が異なる値が多くあります。
非対称の種類

非対称係数

歪度係数、または非対称指数 は、分布の非対称性を判断するのに役立つ統計係数です。したがって、非対称係数を計算することにより、グラフで表現しなくても、分布がどのような種類の非対称性を示しているかを知ることができます。

非対称係数を計算するにはさまざまな式があり、それらをすべて以下に示しますが、使用する式に関係なく、非対称係数の解釈は常に次のように行われます。

  • の歪度係数が正の場合、分布は正に歪んでいます。
  • の非対称係数がゼロに等しい場合、分布は対称です。
  • の歪度係数が負の場合、分布は負に歪んでいます

フィッシャーの非対称係数

フィッシャーの歪度係数は、平均値をサンプル標準偏差で割った値に関する 3 次モーメントに等しくなります。したがって、フィッシャーの非対称係数の式は次のようになります。

\displaystyle\gamma_1=\frac{\mu_3}{\sigma^3}

同様に、次の 2 つの式のいずれかを使用してフィッシャー係数を計算できます。

\displaystyle\gamma_1=\frac{\displaystyle \sum_{i=1}^N\left(x_i-\mu\right)^3}{N\cdot \sigma ^3}

\displaystyle\gamma_1=\frac{\operatorname{E}[X^3] - 3\mu\sigma^2 - \mu^3}{\sigma^3}

E

は数学的な期待値であり、

\mu

算術平均、

\sigma

標準偏差と

N

データの総数。

一方、データがグループ化されている場合は、次の式を使用できます。

\displaystyle\gamma_1=\frac{\displaystyle \sum_{i=1}^N\left(x_i-\mu\right)^3\cdot f_i}{N\cdot \sigma ^3}

この場合どこに

x_i

それはクラスの証であり、

f_i

コースの絶対頻度。

ピアソンの非対称係数

ピアソンの歪度係数は、サンプル平均と最頻値の差を標準偏差 (または標準偏差) で割ったものに等しくなります。したがって、ピアソンの非対称係数の式は次のようになります。

A_p=\cfrac{\mu-Mo}{\sigma}

A_p

はピアソン係数、

\mu

算術平均、

Mo

ファッションと

\sigma

標準偏差。

ピアソン歪度係数は、単峰分布の場合、つまりデータ内にモードが 1 つだけ存在する場合にのみ計算できることに注意してください。

ボウリーの非対称係数

ボウリーの歪度係数は、第 3 四分位数と第 1 四分位数の合計から中央値の 2 倍を引いた値を、第 3 四分位数と第 1 四分位数の差で割った値に等しくなります。したがって、この非対称係数の式は次のようになります。

A_B=\cfrac{Q_3+Q_1-2\cdot Me}{Q_3-Q_1}

Q_1

そして

Q_3

これらはそれぞれ第 1 四分位数と第 3 四分位数であり、

Me

分布の中央値です。

平坦化

尖度 は歪度とも呼ばれ、分布が平均値付近にどの程度集中しているかを示します。言い換えれば、尖度は分布が急峻であるか平坦であるかを示します。具体的には、分布の尖度が大きいほど、分布は急峻になります (または鋭くなります)。

お世辞

お世辞には 3 つのタイプがあります。

  • Leptocurtic : 分布は非常に尖っています。つまり、データは平均値の周囲に強く集中しています。より正確には、レプトクルティック分布は、正規分布よりもシャープな分布として定義されます。
  • メソクルティック: 分布の尖度は正規分布の尖度に相当します。したがって、鋭いともお世辞とも言えません。
  • Platykurtic : 分布は非常に平坦です。つまり、平均値付近の濃度が低いことを意味します。正式には、板状分布は正規分布より平坦な分布として定義されます。

さまざまなタイプの尖度は、正規分布の尖度を基準として定義されることに注意してください。

お世辞の種類

尖度係数

尖度係数の式は次のとおりです。

\displaystyle g_2=\frac{1}{N}\cdot\frac{\displaystyle \sum_{i=1}^N(x_i-\mu)^4}{\sigma^4}-3

度数表にグループ化されたデータの尖度係数の式は次のとおりです。

\displaystyle g_2=\frac{1}{N}\cdot\frac{\displaystyle \sum_{i=1}^N f_i\cdot(x_i-\mu)^4}{\sigma^4}-3

最後に、間隔にグループ化されたデータの尖度係数の式は次のとおりです。

\displaystyle g_2=\frac{1}{N}\cdot\frac{\displaystyle \sum_{i=1}^N f_i\cdot(c_i-\mu)^4}{\sigma^4}-3

金:

  • g_2

    尖度係数です。

  • N

    はデータの総数です。

  • x_i

    はシリーズの i 番目のデータ ポイントです。

  • \mu

    は分布の算術平均です。

  • \sigma

    分布の標準偏差 (または典型偏差) です。

  • f_i

    は、データセットの絶対周波数です。

  • c_i

    は i 番目のグループのクラスマークです。

すべての尖度係数の式では、正規分布の尖度値であるため 3 が減算されることに注意してください。したがって、尖度係数の計算は、正規分布の尖度を基準として行われます。このため、統計では過剰な尖度が計算されると言われることがあります。

尖度係数が計算されたら、次のように解釈して尖度のタイプを特定する必要があります。

  • 尖度係数が正の場合、分布がレプトクであることを意味します。
  • 尖度係数が 0 の場合、分布がメソクルティックであることを意味します。
  • 尖度係数が負の場合、分布が平坦であることを意味します。

歪度と尖度の計算ツール

次の計算機にデータ セットを入力して、その歪度と尖度係数を計算し、分布の種類を決定します。データはスペースで区切られ、小数点としてピリオドを使用して入力する必要があります。

非対称性と尖度は何に使用されますか?

最後に、統計で歪度と尖度が何に使用されるのか、そしてこれら 2 種類の統計パラメーターがどのように解釈されるのかを見ていきます。

歪度と尖度は、グラフで表現する必要なく、確率分布の形状を定義するために使用されます。つまり、通常は多大な時間と労力がかかるグラフ化を行わずに、歪度と尖度を計算して分布の種類を決定します。

さらに、歪度と尖度の値は、分布の曲線を正規分布と比較するために使用されます。それらが類似している場合、これは調査対象の分布を正規分布に近似できることを意味し、したがっていくつかの統計定理を適用できるためです。

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です