Rで列値の分布をプロットする方法
次のメソッドを使用して、R の列値の分布をプロットできます。
方法 1: 密度プロットを使用して値の分布をプロットする
plot(density(df$my_column))
方法 2: ヒストグラムを使用して値の分布をプロットする
hist(df$my_column)
次の例は、次のデータ フレームで各メソッドを実際に使用する方法を示しています。
#create data frame df = data. frame (team=rep(c(' A ', ' B '), each= 10 ), points=c(3, 3, 4, 5, 4, 7, 7, 7, 10, 11, 8, 7, 8, 9, 12, 12, 12, 14, 15, 17)) #view data frame df team points 1 to 3 2 to 3 3 to 4 4 to 5 5 to 4 6 to 7 7 to 7 8 to 7 9 to 10 10 to 11 11 B 8 12 B 7 13 B 8 14 B 9 15 B 12 16 B 12 17 B 12 18 B 14 19 B 15 20 B 17
例 1: 密度プロットを使用して値の分布をプロットする
次のコードは、密度プロットを使用してポイント列の値の分布をプロットする方法を示しています。
#plot distribution of values in points column
plot(density(df$points))
この構文は、変数の値の分布を要約する滑らかな曲線を生成します。
必要に応じて、密度プロットのタイトル、軸ラベル、線の色も変更できることに注意してください。
#plot distribution of values in points column plot(density(df$points), col=' red ', main=' Density Plot of Points ', xlab=' Points ')
例 2: ヒストグラムを使用して値の分布をプロットする
次のコードは、ヒストグラムを使用してポイントの列の値の分布をプロットする方法を示しています。
#plot distribution of values in points column using histogram
hist(df$points)
ヒストグラムは、分布の形状を要約する滑らかな線とは対照的に、バーを使用して点の列内の値の頻度を表します。
ヒストグラムで使用されるタイトル、軸ラベル、色、ジャンプ数も変更できることに注意してください。
#plot distribution of values in points column using histogram hist(df$points, main=' Histogram of Points ', xlab=' Points ', col=' steelblue ', breaks= 12 )
注: Breaks引数に選択した値が大きいほど、ヒストグラムに含まれるバーの数が増えます。
追加リソース
次のチュートリアルでは、R で他の一般的なタスクを実行する方法について説明します。
Rでヒストグラムに縦線を追加する方法
R でカーネル密度プロットを作成する方法
ggplot2 で密度プロットをオーバーレイする方法