R で正規分布をプロットする方法
R で正規分布をプロットするには、基本 R を使用するか、ggplot2 のようなより高度なパッケージをインストールすることができます。
BaseR の使用
ここでは、Base R を使用して正規分布プロットを作成する 3 つの例を示します。
例 1: 平均 = 0、標準偏差 = 1 の正規分布
平均 = 0、標準偏差 = 1 の正規分布プロットを作成するには、次のコードを使用できます。
#Create a sequence of 100 equally spaced numbers between -4 and 4 x <- seq(-4, 4, length=100) #create a vector of values that shows the height of the probability distribution #for each value in x y <- dnorm(x) #plot x and y as a scatterplot with connected lines (type = "l") and add #an x-axis with custom labels plot(x,y, type = "l", lwd = 2, axes = FALSE, xlab = "", ylab = "") axis(1, at = -3:3, labels = c("-3s", "-2s", "-1s", "mean", "1s", "2s", "3s"))
これにより、次のプロットが生成されます。
例 2: 平均 = 0、標準偏差 = 1 の正規分布 (コードが少ない)
次のコードを使用して、 xとyを定義せずに、単純に「curve」関数を使用して正規分布プロットを作成することもできます。
curve(dnorm, -3.5, 3.5, lwd=2, axes = FALSE, xlab = "", ylab = "") axis(1, at = -3:3, labels = c("-3s", "-2s", "-1s", "mean", "1s", "2s", "3s"))
これにより、まったく同じプロットが生成されます。
例 3: カスタム平均と標準偏差を使用した正規分布
ユーザー定義の平均と標準偏差を使用して正規分布プロットを作成するには、次のコードを使用できます。
#define population mean and standard deviation population_mean <- 50 population_sd <- 5 #define upper and lower bound lower_bound <- population_mean - population_sd upper_bound <- population_mean + population_sd #Create a sequence of 1000 x values based on population mean and standard deviation x <- seq(-4, 4, length = 1000) * population_sd + population_mean #create a vector of values that shows the height of the probability distribution #for each value in x y <- dnorm(x, population_mean, population_sd) #plot normal distribution with customized x-axis labels plot(x,y, type = "l", lwd = 2, axes = FALSE, xlab = "", ylab = "") sd_axis_bounds = 5 axis_bounds <- seq(-sd_axis_bounds * population_sd + population_mean, sd_axis_bounds * population_sd + population_mean, by = population_sd) axis(side = 1, at = axis_bounds, pos = 0)
これにより、次のプロットが生成されます。
ggplot2の使用
R で正規分布プロットを作成するもう 1 つの方法は、ggplot2 パッケージを使用することです。ここでは、ggplot2 を使用して正規分布プロットを作成する 2 つの例を示します。
例 1: 平均 = 0、標準偏差 = 1 の正規分布
平均 = 0、標準偏差 = 1 の正規分布プロットを作成するには、次のコードを使用できます。
#install (if not already installed) and load ggplot2 if(!(require(ggplot2))){install.packages('ggplot2')} #generate a normal distribution plot ggplot(data.frame(x = c(-4, 4)), aes(x = x)) + stat_function(fun = dnorm)
これにより、次のプロットが生成されます。
例 2: 「mtcars」データセットを使用した正規分布
次のコードは、 mtcars埋め込み R データセットのガロンあたりのマイル数列の正規分布を作成する方法を示しています。
ggplot(mtcars, aes(x = mpg)) + stat_function( fun = dnorm, args = with(mtcars, c(mean = mean(mpg), sd = sd(mpg))) ) + scale_x_continuous("Miles per gallon")
これにより、次のプロットが生成されます。