Kapan menggunakan stat=”identity” di plot ggplot2


Ada dua cara umum menggunakan fungsi geom_bar() di ggplot2 untuk membuat diagram batang:

Metode 1: Gunakan geom_bar()

 ggplot(df, aes(x)) +
  geom_bar()

Secara default, geom_bar() hanya akan menghitung kemunculan setiap nilai unik untuk variabel x dan menggunakan bilah untuk menampilkan hitungannya.

Metode 2: Gunakan geom_bar(stat=”identitas”)

 ggplot(df, aes(x, y)) +
  geom_bar(stat=" identity ")

Jika Anda memberikan argumen stat=”identity” ke geom_bar() maka Anda meminta R untuk menghitung jumlah variabel y, dikelompokkan berdasarkan variabel x dan menggunakan batang untuk menampilkan jumlahnya.

Contoh berikut mengilustrasikan perbedaan antara kedua metode ini menggunakan kerangka data berikut di R yang menunjukkan poin yang dicetak oleh pemain bola basket dari tim berbeda:

 #create data frame
df <- data. frame (team=rep(c(' A ', ' B ', ' C '), each= 4 ),
                 points=c(3, 5, 5, 6, 5, 7, 7, 8, 9, 9, 9, 8))

#view data frame
df

   team points
1 to 3
2 to 5
3 to 5
4 to 6
5 B 5
6 B 7
7 B 7
8 B 8
9 C 9
10 C 9
11 C 9
12 C 8

Contoh 1: Menggunakan geom_bar()

Kode berikut menunjukkan cara menggunakan fungsi geom_bar() untuk membuat diagram batang yang menampilkan jumlah setiap nilai unik di kolom tim :

 library (ggplot2)

#create bar chart to visualize occurrence of each unique value in team column
ggplot(df, aes(team)) +
  geom_bar()

Sumbu X menampilkan nilai unik di kolom Tim , dan sumbu Y menampilkan berapa kali setiap nilai unik muncul.

Karena setiap nilai unik muncul 4 kali, tinggi setiap batang adalah 4 dalam plot.

Contoh 2: Menggunakan geom_bar(stat=”identitas”)

Kode berikut menunjukkan cara menggunakan fungsi geom_bar() dengan argumen stat=”identity” untuk membuat diagram batang yang menampilkan jumlah nilai pada kolom poin , dikelompokkan berdasarkan tim :

 library (ggplot2)

#create bar chart to visualize sum of points, grouped by team
ggplot(df, aes(team, points)) +
  geom_bar(stat=" identity ")

geom_bar dengan stat="identitas" di ggplot2

Sumbu X menampilkan nilai unik pada kolom tim dan sumbu Y menampilkan jumlah nilai pada kolom poin setiap tim.

Misalnya:

  • Jumlah poin tim A adalah 19.
  • Total poin Tim B adalah 27.
  • Jumlah poin untuk tim C adalah 35.

Dengan menggunakan stat=”identity” pada fungsi geom_bar() , kita dapat menampilkan jumlah nilai variabel tertentu dalam bingkai data kita, bukan hitungan.

Catatan : Agar stat=”identity” berfungsi dengan benar, Anda harus menyediakan variabel x dan variabel ay dalam argumen aes() .

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di ggplot2:

Cara menyesuaikan spasi antar bilah di ggplot2
Cara menghapus NA dari plot di ggplot2
Cara mengubah warna batang di bagan Bart Bertumpuk di ggplot2

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *