Ggplot2 の geom_bar() を使用して平均をプロットする方法
ggplot2 のgeom_bar()関数を使用して、次の基本構文を使用してグループごとに平均値をプロットできます。
library (ggplot2) ggplot(df, aes(group_var, values_var)) + geom_bar(position=' dodge ', stat=' summary ', fun=' mean ')
次の例は、この構文を実際に使用する方法を示しています。
注: geom_bar()のfun引数は、バーを使用して表示する記述統計を ggplot2 に指示します。 「中央値」などの別の記述統計量をこの引数に渡して、グループごとに中央値をプロットすることもできます。
例: ggplot2 の geom_bar() で平均値をプロットする
さまざまなチームのバスケットボール選手が獲得したポイント数に関する情報を含む次のデータ フレームがあるとします。
#create data frame df <- data. frame (team=rep(c(' A ', ' B ', ' C '), each= 4 ), points=c(3, 5, 5, 6, 5, 7, 7, 8, 9, 9, 9, 8)) #view data frame df team points 1 to 3 2 to 5 3 to 5 4 to 6 5 B 5 6 B 7 7 B 7 8 B 8 9 C 9 10 C 9 11 C 9 12 C 8
次の構文を使用して、各棒がチームごとにグループ化された平均ポイント値を表す棒グラフを作成できます。
library (ggplot2) #create bar plot to visualize mean points value by team ggplot(df, aes(team, points)) + geom_bar(position=' dodge ', stat=' summary ', fun=' mean ')
各バーの高さは、各チームの平均ポイント値を表します。
各チームの実際の平均ポイント値を表示するには、 dplyrパッケージのsummarise()関数を使用できます。
library (dplyr) #calculate mean value of points, grouped by team df %>% group_by(team) %>% summarise(mean_pts = mean(points, na. rm = TRUE )) # A tibble: 3 x 2 team mean_pts 1 to 4.75 2 B 6.75 3 C 8.75
結果から、各チームの平均ポイント値がわかります。
- チームA: 4.75
- チームB: 6.75
- チームC: 8.75
これらの値は、上の棒グラフに表示される棒の高さに対応します。
追加リソース
次のチュートリアルでは、ggplot2 で他の一般的なタスクを実行する方法を説明します。
ggplot2でバー間のスペースを調整する方法
ggplot2 のプロットから NA を削除する方法
ggplot2の積み上げ棒グラフで棒の色を変更する方法