Cara membuat plot biola di ggplot2 (dengan contoh)
Anda dapat menggunakan metode berikut untuk membuat plot biola di ggplot2:
Metode 1: membuat plot biola berdasarkan kelompok
ggplot(df, aes(x=group_var, y=values_var, fill=group_var)) +
geom_violin() +
Metode 2: Buat jalur biola horizontal berdasarkan kelompok
ggplot(df, aes(x=group_var, y=values_var, fill=group_var)) +
geom_violin() +
coordinate_flip()
Metode 3: Membuat Plot Biola Berdasarkan Kelompok dan Tunjukkan Nilai Median
ggplot(df, aes(x=group_var, y=values_var, fill=group_var)) +
geom_violin() +
stat_summary(fun=median, geom=' point ', size= 2 )
Contoh berikut menunjukkan cara menggunakan setiap metode dalam praktik dengan kerangka data berikut di R:
#make this example reproducible
set. seeds (1)
#create data frame
df <- data. frame (team=rep(c(' A ', ' B ', ' C '), each= 100 ),
points=c(rnorm(100, mean=10),
rnorm(100, mean=15),
rnorm(100, mean=20)))
#view head of data frame
head(df)
team points
1 A 9.373546
2 A 10.183643
3 A 9.164371
4 A 11.595281
5 A 10.329508
6 A 9.179532
Catatan : Kami menggunakan fungsi set.seed() untuk memastikan contoh ini dapat direproduksi.
Contoh 1: Membuat penelusuran biola berdasarkan kelompok
Kita dapat menggunakan sintaks berikut untuk membuat plot biola yang menunjukkan distribusi variabel poin , yang dikelompokkan berdasarkan variabel tim :
library (ggplot2)
#create violin plot to visualize distribution of points by team
ggplot(df, aes(x=team, y=points, fill=team)) +
geom_violin()
Sumbu x menampilkan setiap tim dan sumbu y menampilkan distribusi poin yang dicetak setiap tim.
Contoh 2: Membuat Jejak Biola berdasarkan Grup
Untuk membuat plot biola horizontal yang menunjukkan distribusi variabel poin , yang dikelompokkan berdasarkan variabel tim , cukup tambahkan fungsi coord_flip() :
library (ggplot2)
#create horizontal violin plots to visualize distribution of points by team
ggplot(df, aes(x=team, y=points, fill=team)) +
geom_violin() +
coordinate_flip()
Sumbu y menampilkan setiap tim dan sumbu x menampilkan distribusi poin yang dicetak setiap tim.
Contoh 3: Buat plot biola berdasarkan kelompok dan tampilkan nilai mediannya
Kode berikut menunjukkan cara membuat plot biola yang menunjukkan sebaran variabel poin , dikelompokkan berdasarkan variabel tim , dengan nilai median poin diwakili oleh lingkaran:
library (ggplot2)
#create violin plots and display median points value as circle
ggplot(df, aes(x=team, y=points, fill=team)) +
geom_violin() +
stat_summary(fun=median, geom=' point ', size= 2 )
Nilai median poin setiap tim diwakili oleh lingkaran kecil di dalam setiap fiddle plot.
Catatan : Untuk memperbesar ukuran lingkaran, cukup tambah nilai argumen size di fungsi stat_summary() .
Sumber daya tambahan
Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di ggplot2:
Cara mengubah ukuran font di ggplot2
Cara menghapus legenda di ggplot2
Cara memutar label sumbu di ggplot2