R で歪度と尖度を計算する方法


統計学では、歪度尖度は分布の形状を測定する 2 つの方法です。

歪度は、分布の歪度の尺度です。この値は正または負の値にすることができます。

  • 負の歪度は、裾が分布の左側にあり、より負の値に向かって広がっていることを示します。
  • 正の歪みは、裾が分布の右側にあり、より正の値に向かって広がっていることを示します。
  • 値 0 は、分布に非対称性がないことを示し、分布が完全に対称であることを意味します。

尖度は、正規分布と比較して分布の裾が重いか軽いかを示す尺度です。

  • 正規分布の尖度は 3 です。
  • 特定の分布の尖度が 3 未満の場合、その分布はplaykurticであると言われます。これは、正規分布よりも極端な外れ値が少なくなる傾向があることを意味します。
  • 特定の分布の尖度が 3 を超える場合、その分布はレプトクリティであると言われます。これは、正規分布よりも外れ値が多くなる傾向があることを意味します。

注:一部の式 (フィッシャーの定義) では、正規分布との比較を容易にするために、尖度から 3 が減算されます。この定義を使用すると、尖度値が 0 より大きい分布の尖度は正規分布よりも大きくなります。

このチュートリアルでは、R で特定のデータセットの歪度と尖度の両方を計算する方法について説明します。

例: R の歪度と平坦化

次のデータセットがあるとします。

 data = c(88, 95, 92, 97, 96, 97, 94, 86, 91, 95, 97, 88, 85, 76, 68)

ヒストグラムを作成することで、このデータセット内の値の分布をすばやく視覚化できます。

 hist(data, col=' steelblue ') 

R の歪度と尖度

ヒストグラムは、分布が左に偏っているように見えることを示しています。つまり、値の大部分が分布の右側に集中しています。

このデータセットの歪度と尖度を計算するには、R のモーメントライブラリのskewness()関数とkurtosis()関数を使用できます。

 library (moments)

#calculate skewness
skewness(data)

[1] -1.391777

#calculate kurtosis
kurtosis(data)

[1] 4.177865

歪度は-1.391777 、尖度は4.177865であることがわかります。

歪度が負であるため、これは分布が歪んだままであることを示します。これは、ヒストグラムで確認された内容を裏付けています。

尖度は 3 より大きいため、正規分布と比較して分布の裾に多くの値があることを示します。

momentsライブラリは、 jarque.test()関数も提供します。この関数は、サンプル データが正規分布と一致する歪度と尖度を示すかどうかを判断する適合度テストを実行します。この検定の帰無仮説と対立仮説は次のとおりです。

帰無仮説: データセットには正規分布に対応する歪度と尖度があります。

対立仮説: データセットには正規分布に対応しない歪みと尖度があります。

次のコードは、このテストを実行する方法を示しています。

 jarque.test(data)

	Jarque-Bera Normality Test

data:data
JB = 5.7097, p-value = 0.05756
alternative hypothesis: greater

検定の p 値は0.05756であることがわかります。この値は α = 0.05 以上であるため、帰無仮説を棄却できません。このデータセットの歪度と尖度が正規分布とは異なると言える十分な証拠はありません。

Moments Library の完全なドキュメントはここにあります。

ボーナス: 歪度と尖度の計算ツール

統計的歪度と尖度の計算ツール を使用して、特定のデータセットの歪度を計算することもできます。これにより、特定のデータセットの歪度と尖度が自動的に計算されます。

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です