Rで列値の分布をプロットする方法


次のメソッドを使用して、R の列値の分布をプロットできます。

方法 1: 密度プロットを使用して値の分布をプロットする

 plot(density(df$my_column))

方法 2: ヒストグラムを使用して値の分布をプロットする

 hist(df$my_column)

次の例は、次のデータ フレームで各メソッドを実際に使用する方法を示しています。

 #create data frame
df = data. frame (team=rep(c(' A ', ' B '), each= 10 ),
                points=c(3, 3, 4, 5, 4, 7, 7, 7, 10, 11, 8,
                         7, 8, 9, 12, 12, 12, 14, 15, 17))

#view data frame
df

   team points
1 to 3
2 to 3
3 to 4
4 to 5
5 to 4
6 to 7
7 to 7
8 to 7
9 to 10
10 to 11
11 B 8
12 B 7
13 B 8
14 B 9
15 B 12
16 B 12
17 B 12
18 B 14
19 B 15
20 B 17

例 1: 密度プロットを使用して値の分布をプロットする

次のコードは、密度プロットを使用してポイント列の値の分布をプロットする方法を示しています。

 #plot distribution of values in points column
plot(density(df$points)) 

この構文は、変数の値の分布を要約する滑らかな曲線を生成します。

必要に応じて、密度プロットのタイトル、軸ラベル、線の色も変更できることに注意してください。

 #plot distribution of values in points column
plot(density(df$points), col=' red ', main=' Density Plot of Points ', xlab=' Points ')

密度プロットを使用して R の列値の分布をプロットします

例 2: ヒストグラムを使用して値の分布をプロットする

次のコードは、ヒストグラムを使用してポイントの列の値の分布をプロットする方法を示しています。

 #plot distribution of values in points column using histogram
hist(df$points)

ヒストグラムは、分布の形状を要約する滑らかな線とは対照的に、バーを使用して点の列内の値の頻度を表します。

ヒストグラムで使用されるタイトル、軸ラベル、色、ジャンプ数も変更できることに注意してください。

 #plot distribution of values in points column using histogram
hist(df$points, main=' Histogram of Points ', xlab=' Points ', col=' steelblue ', breaks= 12 )

ヒストグラムを使用してRの列値の分布をプロットします

: Breaks引数に選択した値が大きいほど、ヒストグラムに含まれるバーの数が増えます。

追加リソース

次のチュートリアルでは、R で他の一般的なタスクを実行する方法について説明します。

Rでヒストグラムに縦線を追加する方法
R でカーネル密度プロットを作成する方法
ggplot2 で密度プロットをオーバーレイする方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です