Ggplot2 で qq プロットを作成する方法 (例付き)


「分位数-分位数」の略であるQQ プロットは、データセットが理論的な分布に由来する可能性があるかどうかを評価するために使用されます。

ほとんどの場合、このタイプのプロットは、データ セットが正規分布に従うかどうかを判断するために使用されます。

データが正規分布している場合、QQ プロット上の点は直線の対角線上にあります。

逆に、点が直線の対角線から大きく外れている場合は、データが正規分布している可能性は低くなります。

ggplot2 で QQ プロットを作成するには、次のようにstat_qq()関数とstat_qq_line()関数を使用します。

 library (ggplot2)

ggplot(df, aes(sample=y)) +
  stat_qq() + 
  stat_qq_line()

次の例は、この構文を使用して 2 つの異なるシナリオで QQ プロットを作成する方法を示しています。

例 1: 通常データの QQ プロット

次のコードは、200 個の観測値を含む正規分布データセットを生成し、R でそのデータセットの QQ プロットを作成する方法を示しています。

 library (ggplot2)

#make this example reproducible
set. seeds (1)

#create some fake data that follows a normal distribution
df <- data. frame (y=rnorm(200))

#create QQ plot
ggplot(df, aes(sample=y)) +
  stat_qq() + 
  stat_qq_line()

ggplot2 の QQ プロット

点は主に直線の対角線に沿って配置されていますが、各尾部に沿って若干のずれがあることがわかります。

このグラフに基づいて、このデータセットは正規分布していると仮定します。

必要に応じて、 color 引数と size 引数を使用して、プロット内の点の色とサイズを変更することもできることに注意してください。

 library (ggplot2)

#make this example reproducible
set. seeds (1)

#create some fake data that follows a normal distribution
df <- data. frame (y=rnorm(200))

#create QQ plot
ggplot(df, aes(sample=y)) +
  stat_qq(size= 2.5 , color=' red ') + 
  stat_qq_line() 

例 2: 非正規データの QQ プロット

次のコードは、200 個の観測値を含む指数分布に従うデータ セットの QQ プロットを作成する方法を示しています。

 #make this example reproducible
set. seeds (1)

#create some fake data that follows an exponential distribution
df <- data. frame (y=rexp( 200 , rate= 3 ))

#create QQ plot
ggplot(df, aes(sample=y)) +
  stat_qq() + 
  stat_qq_line()

点が対角線から大きくずれていることがわかります。これは、データセットが正規分布していないことを明確に示しています。

データが指数分布に従うように指定したことを考えると、これは当然のことです。

追加リソース

次のチュートリアルでは、ggplot2 で他の一般的なタスクを実行する方法を説明します。

ggplot2 で複数の行をプロットする方法
ggplot2 で平均と標準偏差をプロットする方法
ggplot2で線の色を変更する方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です