Ggplot2 の geom_bar() を使用して平均をプロットする方法


ggplot2 のgeom_bar()関数を使用して、次の基本構文を使用してグループごとに平均値をプロットできます。

 library (ggplot2)

ggplot(df, aes(group_var, values_var)) +
  geom_bar(position=' dodge ', stat=' summary ', fun=' mean ')

次の例は、この構文を実際に使用する方法を示しています。

: geom_bar()fun引数は、バーを使用して表示する記述統計を ggplot2 に指示します。 「中央値」などの別の記述統計量をこの引数に渡して、グループごとに中央値をプロットすることもできます。

例: ggplot2 の geom_bar() で平均値をプロットする

さまざまなチームのバスケットボール選手が獲得したポイント数に関する情報を含む次のデータ フレームがあるとします。

 #create data frame
df <- data. frame (team=rep(c(' A ', ' B ', ' C '), each= 4 ),
                 points=c(3, 5, 5, 6, 5, 7, 7, 8, 9, 9, 9, 8))

#view data frame
df

   team points
1 to 3
2 to 5
3 to 5
4 to 6
5 B 5
6 B 7
7 B 7
8 B 8
9 C 9
10 C 9
11 C 9
12 C 8

次の構文を使用して、各棒がチームごとにグループ化された平均ポイント値を表す棒グラフを作成できます。

 library (ggplot2)

#create bar plot to visualize mean points value by team
ggplot(df, aes(team, points)) +
  geom_bar(position=' dodge ', stat=' summary ', fun=' mean ') 

ggplot2 の geom_bar を使用して平均をプロットする

各バーの高さは、各チームの平均ポイント値を表します。

各チームの実際の平均ポイント値を表示するには、 dplyrパッケージのsummarise()関数を使用できます。

 library (dplyr)

#calculate mean value of points, grouped by team
df %>%
  group_by(team) %>%
  summarise(mean_pts = mean(points, na. rm = TRUE ))

# A tibble: 3 x 2
  team mean_pts
      
1 to 4.75
2 B 6.75
3 C 8.75

結果から、各チームの平均ポイント値がわかります。

  • チームA: 4.75
  • チームB: 6.75
  • チームC: 8.75

これらの値は、上の棒グラフに表示される棒の高さに対応します。

追加リソース

次のチュートリアルでは、ggplot2 で他の一般的なタスクを実行する方法を説明します。

ggplot2でバー間のスペースを調整する方法
ggplot2 のプロットから NA を削除する方法
ggplot2の積み上げ棒グラフで棒の色を変更する方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です