Cara memplot garis regresi berdasarkan grup dengan ggplot2


Kita dapat menggunakan sintaks berikut untuk memplot garis regresi grup menggunakan paket visualisasi R ggplot2 :

 ggplot(df, aes (x = x_variable, y = y_variable, color = group_variable)) +
  geom_point() +
  geom_smooth(method = " lm ", fill = NA )

Tutorial ini memberikan contoh singkat tentang cara menggunakan fungsi ini dalam praktik.

Contoh: memplot garis regresi berdasarkan kelompok dengan ggplot2

Misalkan kita memiliki kumpulan data berikut yang menunjukkan tiga variabel berikut untuk 15 siswa berbeda:

  • Jumlah jam belajar
  • Nilai ujian diterima
  • Teknik belajar yang digunakan (baik A, B atau C)
 #create dataset
df <- data.frame(hours=c(1, 2, 3, 3, 4, 1, 2, 2, 3, 4, 1, 2, 3, 4, 4),
                 score=c(84, 86, 85, 87, 94, 74, 76, 75, 77, 79, 65, 67, 69, 72, 80),
                 technique= rep (c(' A ', ' B ', ' C '), each = 5 ))

#view dataset
df

   hours technical score
1 1 84 A
2 2 86 A
3 3 85 A
4 3 87 A
5 4 94 A
6 1 74 B
7 2 76 B
8 2 75 B
9 3 77 B
10 4 79 B
11 1 65 C
12 2 67 C
13 3 69 C
14 4 72 C
15 4 80 C

Kode berikut menunjukkan cara membuat garis regresi yang menangkap hubungan antara jam belajar dan nilai ujian untuk masing-masing dari tiga teknik belajar:

 #load ggplot2
library (ggplot2)

#create regression lines for all three groups
ggplot(df, aes (x = hours, y = score, color = technique)) +
  geom_point() +
  geom_smooth(method = " lm ", fill = NA )

Regresi baris demi grup di ggplot2

Perhatikan bahwa di geom_smooth() kami menggunakan metode = ‘lm” untuk menentukan tren linier.

Kita juga dapat menggunakan metode penghalusan lain seperti “glm”, “loess” atau “gam” untuk menangkap tren non-linier dalam data. Anda dapat menemukan dokumentasi lengkap untuk geom_smooth() di sini .

Perhatikan bahwa kita juga dapat menggunakan bentuk berbeda untuk menampilkan hasil ujian untuk masing-masing dari tiga kelompok:

 ggplot(df, aes (x = hours, y = score, color = technique, shape = technique)) +
  geom_point() +
  geom_smooth(method = " lm ", fill = NA )

Beberapa garis regresi dalam satu plot di ggplot2

Anda dapat menemukan tutorial ggplot2 lainnya di sini .

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *