Kapan menggunakan stat=”identity” di plot ggplot2
Ada dua cara umum menggunakan fungsi geom_bar() di ggplot2 untuk membuat diagram batang:
Metode 1: Gunakan geom_bar()
ggplot(df, aes(x)) + geom_bar()
Secara default, geom_bar() hanya akan menghitung kemunculan setiap nilai unik untuk variabel x dan menggunakan bilah untuk menampilkan hitungannya.
Metode 2: Gunakan geom_bar(stat=”identitas”)
ggplot(df, aes(x, y)) +
geom_bar(stat=" identity ")
Jika Anda memberikan argumen stat=”identity” ke geom_bar() maka Anda meminta R untuk menghitung jumlah variabel y, dikelompokkan berdasarkan variabel x dan menggunakan batang untuk menampilkan jumlahnya.
Contoh berikut mengilustrasikan perbedaan antara kedua metode ini menggunakan kerangka data berikut di R yang menunjukkan poin yang dicetak oleh pemain bola basket dari tim berbeda:
#create data frame df <- data. frame (team=rep(c(' A ', ' B ', ' C '), each= 4 ), points=c(3, 5, 5, 6, 5, 7, 7, 8, 9, 9, 9, 8)) #view data frame df team points 1 to 3 2 to 5 3 to 5 4 to 6 5 B 5 6 B 7 7 B 7 8 B 8 9 C 9 10 C 9 11 C 9 12 C 8
Contoh 1: Menggunakan geom_bar()
Kode berikut menunjukkan cara menggunakan fungsi geom_bar() untuk membuat diagram batang yang menampilkan jumlah setiap nilai unik di kolom tim :
library (ggplot2) #create bar chart to visualize occurrence of each unique value in team column ggplot(df, aes(team)) + geom_bar()
Sumbu X menampilkan nilai unik di kolom Tim , dan sumbu Y menampilkan berapa kali setiap nilai unik muncul.
Karena setiap nilai unik muncul 4 kali, tinggi setiap batang adalah 4 dalam plot.
Contoh 2: Menggunakan geom_bar(stat=”identitas”)
Kode berikut menunjukkan cara menggunakan fungsi geom_bar() dengan argumen stat=”identity” untuk membuat diagram batang yang menampilkan jumlah nilai pada kolom poin , dikelompokkan berdasarkan tim :
library (ggplot2) #create bar chart to visualize sum of points, grouped by team ggplot(df, aes(team, points)) + geom_bar(stat=" identity ")
Sumbu X menampilkan nilai unik pada kolom tim dan sumbu Y menampilkan jumlah nilai pada kolom poin setiap tim.
Misalnya:
- Jumlah poin tim A adalah 19.
- Total poin Tim B adalah 27.
- Jumlah poin untuk tim C adalah 35.
Dengan menggunakan stat=”identity” pada fungsi geom_bar() , kita dapat menampilkan jumlah nilai variabel tertentu dalam bingkai data kita, bukan hitungan.
Catatan : Agar stat=”identity” berfungsi dengan benar, Anda harus menyediakan variabel x dan variabel ay dalam argumen aes() .
Sumber daya tambahan
Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di ggplot2:
Cara menyesuaikan spasi antar bilah di ggplot2
Cara menghapus NA dari plot di ggplot2
Cara mengubah warna batang di bagan Bart Bertumpuk di ggplot2