Ggplot2 を使用して r でグループ化された箱ひげ図を作成する方法
箱ひげ図は、次のようなデータ セットの 5 桁の概要を視覚化するのに役立ちます。
- 最小
- 最初の四分位
- 中央値
- 第 3 四分位
- 最大
関連: 箱ひげ図の優しい入門
幸いなことに、 ggplot2視覚化ライブラリを使用すると、R で箱ひげ図を簡単に作成できます。
また、データセット内の特定の変数によってグループ化された箱ひげ図を作成することも含まれます。たとえば、2 つの異なるトレーニング プログラムに基づいて、3 つの異なるチームの 150 人のバスケットボール選手の効率の向上を表示する次のデータセットがあるとします。
#define variables team=rep(c('A', 'B', 'C'), each =50) program=rep(c('low', 'high'), each =25) increase=seq(1:150)+sample(1:100, 100, replace= TRUE ) #create dataset using variables data=data.frame(team, program, increase) #view first six rows of dataset head(data) team program increase 1 A low 62 2 A low 37 3 A low 49 4 A low 60 5 A low 64 6 A low 105
次のコードを使用して、プレーヤーの効率の向上を表示する箱ひげ図を作成し、チームごとにグループ化し、トレーニング スケジュールに基づいてデータを入力できます。
library (ggplot2) ggplot(data, aes(x=team, y=increase, fill=program)) + geom_boxplot ()
同様の構文を使用して、プレーヤーの効率の向上を表示する箱ひげ図を作成し、トレーニング プログラムごとにグループ化し、チームごとにデータを入力することができます。
library (ggplot2) ggplot(data, aes(x=program, y=increase, fill=team)) + geom_boxplot ()
同様の代替方法は、各サブグループが独自のパネルに表示されるfaceting を使用することです。
library (ggplot2) ggplot(data, aes(x=team, y=increase, fill=program)) + geom_boxplot () + facet_wrap (~program)
操作しているデータによっては、ファセットの作成が視覚化のニーズを満たす場合もあれば、満たさない場合もあります。
追加リソース
R の箱ひげ図で外れ値を削除する方法
ggplot2 で並列プロットを作成する方法
最高の ggplot2 テーマの完全ガイド