Sas で歪度と尖度を計算する方法
統計学では、歪度と尖度は分布の形状を測定する 2 つの方法です。
歪度は、分布の非対称性を測定します。
- 負の歪度は、裾が分布の左側にあることを示します。
- 正の歪みは、裾が分布の右側にあることを示します。
- 値 0 は、分布に非対称性がないことを示し、分布が完全に対称であることを意味します。
尖度は、正規分布と比較して分布の裾が重いか軽いかを測定します。
- 正規分布の尖度は 0 です。
- 特定の分布の尖度が 0 未満の場合、その分布はplaykurticであると言われます。これは、正規分布よりも極端な外れ値が少なくなる傾向があることを意味します。
- 特定の分布の尖度が 0 より大きい場合、その分布はleptokurticであると言われ、正規分布よりも外れ値が多くなる傾向があることを意味します。
SAS で変数の歪度と尖度を計算するには、 PROC MEANSでSKEWNESSステートメントとKURTOSISステートメントを使用できます。
次の例は、これらの命令を実際に使用する方法を示しています。
例: SAS での歪度と尖度の計算
SAS に、さまざまなバスケットボール選手に関する情報を含む次のデータセットがあるとします。
/*create dataset*/ data my_data; input team $points assists; datalines ; At 10 2 At 17 5 At 17 6 At 18 3 At 15 0 B 10 2 B 14 5 B 13 4 B 29 0 B 25 2 C 12 1 C 30 1 C 34 3 C 12 4 C 11 7 ; run ; /*view dataset*/ proc print data =my_data;
PROC MEANS をSKEWNESSおよびKURTOSISステートメントとともに使用して、データセット内の各数値変数の歪度と尖度を計算できます。
/*calculate skewness and kurtosis for each numeric variable*/ proc means data =my_data SKEWNESS KURTOSIS ; run ;
出力テーブルには、データセット内の各数値変数の歪度と尖度の値が表示されます。
(1) ポイント
- Points 変数の歪度は1.009です。この値は 0 より大きいため、裾が分布の右側にあることを意味します。
- Points 変数の尖度は-0.299です。この値は 0 より小さいため、分布には正規分布よりも外れ値がわずかに少なく、極端な値が少ないことを意味します。
(2) 助けて
- アシスト変数の歪度は0.304です。この値は 0 より大きいため、裾が分布の右側にあることを意味します。
- サポート変数の尖度は-0.782です。この値は 0 より小さいため、分布には正規分布よりも外れ値や極値が少ないことを意味します。
データセット内の各数値変数の値の分布を視覚化するには、 PROC UNIVARIATEを使用してポイント変数とアシスト変数のヒストグラムを作成できます。
/*create histograms for points and assists variables*/
proc univariate data =my_data;
var points assists;
histogram points assists;
run ;
これにより、ポイント変数に対して次のヒストグラムが生成されます。
そして、支援変数の次のヒストグラム:
追加リソース
次のチュートリアルでは、SAS で他の一般的なタスクを実行する方法について説明します。
SAS で記述統計を計算する方法
SAS で度数表を作成する方法
SAS でパーセンタイルを計算する方法
SAS でピボットテーブルを作成する方法