A: ヒストグラム内のビンの数を変更する方法


R でヒストグラムを作成する場合、スタージェス ルールとして知られる式を使用して、使用するグループの最適な数が決定されます。

ただし、次の構文を使用してこの式をオーバーライドし、ヒストグラムで使用するグループの正確な数を指定できます。

 hist(data, breaks = seq(min(data), max(data), length. out = 7 ))

ヒストグラムで使用されるグループの数は、 length.out引数で指定された数より 1 少ないことに注意してください。

次の例は、この構文を実際に使用する方法を示しています。

例 1: 基本的なヒストグラムの作成

次のコードは、ビンの数を指定せずに R で基本的なヒストグラムを作成する方法を示しています。

 #define vector of data
data <- c(1, 2, 2, 3, 4, 4, 4, 5, 5, 6, 7, 10, 11, 13, 16, 16, 16)

#create histogram of data
hist(data, col = ' lightblue ') 

スタージェスの法則を使用して、R はヒストグラムで合計8 つのグループを使用することにしました。

例 2: ヒストグラムで使用するビンの数を指定する

次のコードは、同じデータ ベクトルのヒストグラムを作成し、正確に6 つのグループを使用する方法を示しています。

 #define vector of data
data <- c(1, 2, 2, 3, 4, 4, 4, 5, 5, 6, 7, 10, 11, 13, 16, 16, 16)

#create histogram with 6 bins
hist(data, col = ' lightblue ', breaks = seq(min(data), max(data), length. out = 7 )) 

特定の数のビンを選択する場合の注意事項

ヒストグラムで使用されるグループの数は、データセットの解釈方法に大きな影響を与えます。

使用するグループが少なすぎると、データ内の実際の基礎となるパターンが隠れてしまう可能性があります。

 #define vector of data
data <- c(1, 2, 2, 3, 4, 4, 4, 5, 5, 6, 7, 10, 11, 13, 16, 16, 16)

#create histogram with 3 bins
hist(data, col = ' lightblue ', breaks = seq(min(data), max(data), length. out = 4 )) 

逆に、使用するグループが多すぎる場合は、データセット内のノイズを単純に視覚化することができます。

 #define vector of data
data <- c(1, 2, 2, 3, 4, 4, 4, 5, 5, 6, 7, 10, 11, 13, 16, 16, 16)

#create histogram with 15 bins
hist(data, col = ' lightblue ', breaks = seq(min(data), max(data), length. out = 16 )) 

一般に、R で使用されるデフォルトのスタージェス ルールは、最適な数のグループを含むヒストグラムを生成する傾向があります。

ここで提供されているコードを自由に使用して、正確な数のビンを含むヒストグラムを作成できますが、選択するビンが多すぎたり少なすぎたりしないように注意してください。

追加リソース

次のチュートリアルでは、R でヒストグラムを使用して他の一般的な関数を実行する方法について説明します。

R で複数のヒストグラムをプロットする方法
R で 2 つの変数のヒストグラムを作成する方法
R で相対頻度ヒストグラムを作成する方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です