Kita dapat menggunakan sintaks berikut untuk memplot garis regresi grup menggunakan paket visualisasi R ggplot2 : ggplot(df, aes (x = x_variable, y = y_variable, color = group_variable)) + geom_point() + geom_smooth(method = " lm ", fill = NA ) Tutorial ini...
Salah satu asumsi utama regresi linier adalah tidak adanya korelasi antara residu yang berurutan. Dengan kata lain, kita berasumsi bahwa residunya independen. Jika asumsi ini dilanggar, kesalahan standar koefisien dalam model regresi kemungkinan besar akan diremehkan, yang berarti bahwa variabel prediktor...
Dalam statistik, varian klaster mengacu pada rata-rata dari dua atau lebih varian klaster. Kita menggunakan kata “dikumpulkan” untuk menunjukkan bahwa kita “menggabungkan” dua atau lebih varian kelompok untuk mendapatkan satu angka untuk varian umum antar kelompok. Dalam praktiknya, varians yang dikumpulkan...
Memperoleh data berarti menetapkan outlier ekstrem sama dengan persentil data tertentu. Misalnya, winorisasi 90% menetapkan semua pengamatan di atas persentil ke-95 sama dengan nilai pada persentil ke-95 dan semua pengamatan di bawah persentil ke-5 sama dengan nilai pada persentil ke-5. Memang...
Memperoleh data berarti menetapkan outlier ekstrem sama dengan persentil data tertentu. Misalnya, winorisasi 90% menetapkan semua pengamatan di atas persentil ke-95 sama dengan nilai pada persentil ke-95 dan semua pengamatan di bawah persentil ke-5 sama dengan nilai pada persentil ke-5. Tutorial...
Plot titik bertumpuk adalah jenis plot yang menampilkan frekuensi menggunakan titik. Ada dua metode yang dapat Anda gunakan untuk membuat plot titik bertumpuk di R: Metode 1: Fungsi stripchart() di basis R. Metode 2: Fungsi geom_dotplot() di ggplot2. Tutorial ini memberikan...
Memusatkan kumpulan data berarti mengurangkan nilai rata-rata setiap observasi individu dalam kumpulan data. Misalnya, kita memiliki kumpulan data berikut: Ternyata nilai rata-ratanya adalah 14. Jadi, untuk memusatkan kumpulan data ini, kita akan mengurangi 14 dari setiap observasi: Perhatikan bahwa nilai rata-rata...
Kita dapat menggunakan sintaks berikut untuk menambahkan baris tertentu dari bingkai data di R: with (df, sum (column_1[column_2 == ' some value '])) Sintaks ini menemukan jumlah baris kolom 1 dimana kolom 2 sama dengan nilai, dimana bingkai datanya disebut df...
Fungsi ifelse() di basis R dapat digunakan untuk menulis pernyataan if-else dengan cepat. Fungsi ini menggunakan sintaks berikut: ifelse(tes, ya, tidak) Emas: tes: tes logis yes: Nilai yang akan dikembalikan jika tes logikanya Benar no: Nilai yang akan dikembalikan jika tes...
Seringkali Anda perlu mengonversi angka ke format tanggal di R. Cara termudah untuk melakukannya adalah dengan menggunakan paket lubridate , yang memiliki beberapa fungsi berguna untuk menangani tanggal di R. Tutorial ini memberikan beberapa contoh bagaimana menggunakan fungsi-fungsi ini dalam praktik....