相対度数分布とは何ですか?


頻度分布は、データセット内に異なる値がどのくらいの頻度で現れるかを表します。

たとえば、都市内の 400 世帯の 単純な無作為サンプルを収集し、各世帯のペットの数を記録するとします。次の表に結果を示します。

この表は頻度分布を表します。

関連する分布は相対度数分布として知られており、データ セット内の各値の相対度数をすべての度数に対するパーセンテージとして示します。

たとえば、前の表では、合計 400 世帯があることがわかりました。分布内の各値の相対頻度を見つけるには、個々の頻度を 400 で割るだけです。

相対度数分布

相対度数分布には次の特性があることに注意してください。

  • それぞれの相対頻度の範囲は 0% から 100% です。
  • 個々の相対頻度をすべて合計すると 100% になります。

これらの条件が満たされない場合、相対度数分布は無効になります。

相対度数分布が役立つ理由

相対度数分布は、データ セット内の値が他のすべての値と比較してどの程度一般的であるかを理解できるため便利です。

前の例では、150 世帯がペットを 1 匹しか飼っていないことがわかりました。しかし、この数字自体は特に役に立ちません。

むしろ、サンプルに含まれる全世帯の37.5%がペットを 1 匹しか飼っていなかったということを知る方が有益です。これは、3 世帯に 1 世帯強がペットを 1 匹しか飼っていないことを理解するのに役立ち、1 匹のペットを飼うことがいかに「一般的」であるかがわかります。

相対度数分布の視覚化

相対度数分布を視覚化する最も一般的な方法は、 相対度数ヒストグラムを作成することです。これは、グラフの x 軸に沿って個々のデータ値を表示し、y 軸に沿って各クラスの相対度数を表すバーを使用します。

たとえば、前の例のデータの相対頻度ヒストグラムは次のようになります。

X 軸は世帯内のペットの数を表示し、Y 軸はその数のペットを所有する世帯の相対頻度を表示します。

このヒストグラムは、相対度数分布を視覚化するのに便利な方法です。

追加リソース

相対周波数計算機
Excelで相対周波数を計算する方法
Python で相対周波数を計算する方法
R で相対頻度ヒストグラムを作成する方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です