Dalam statistik, skor-z memberi tahu kita berapa banyak standar deviasi suatu nilai tertentu dari rata-rata populasi. Kami menggunakan rumus berikut untuk menghitung skor-z untuk nilai tertentu: z = (x – μ) / σ Emas: x : Nilai data individual μ :...
Kesalahan yang mungkin Anda temui di R adalah: Error: Discrete value supplied to continuous scale Kesalahan ini terjadi saat Anda mencoba menerapkan skala berkelanjutan ke sumbu di ggplot2, ketika variabel pada sumbu tersebut bukan numerik. Tutorial ini menjelaskan dengan tepat cara...
Anda dapat menggunakan sintaks dasar berikut untuk menghitung deviasi standar kolom di R: #calculate standard deviation of one column sd(df$col1) #calculate standard deviation of all columns sapply(df, sd) #calculate standard deviation of specific columns sapply(df[c(' col1 ', ' col2 ', '...
Fungsi colMeans() di R dapat digunakan untuk menghitung rata-rata beberapa kolom matriks atau bingkai data di R. Fungsi ini menggunakan sintaks dasar berikut: #calculate column means of every column colMeans(df) #calculate column means and exclude NA values colMeans(df, na. rm =...
Uji tanda adalah uji nonparametrik yang digunakan untuk menentukan apakah suatu populasi sama dengan median suatu nilai tertentu. Contoh langkah demi langkah berikut ini memperlihatkan cara melakukan tes tanda di Excel. Langkah 1: Masukkan datanya Misalkan sebuah pabrik mengklaim memproduksi gadget...
Dalam statistik, data kategorikal mewakili data yang dapat diberi nama atau label. Contohnya meliputi: Status merokok (“perokok”, “bukan perokok”) Warna mata (“biru”, “hijau”, “cokelat”) Tingkat pendidikan (misalnya “sekolah menengah atas”, “gelar sarjana”, “gelar master”) Tiga bagan yang umum digunakan untuk memvisualisasikan...
Anda dapat menggunakan sintaks dasar berikut untuk mengelompokkan variabel di dplyr: df %>% arrange (group_var, numeric_var) %>% group_by (group_var) %>% mutate (rank = rank(numeric_var)) Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya dengan bingkai data berikut: #create data frame df...
Anda dapat menggunakan sintaks dasar berikut untuk menjumlahkan kolom berdasarkan kondisi di R: #sum values in column 3 where col1 is equal to 'A' sum(df[ which (df$col1==' A '), 3]) Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya dengan bingkai...
Dalam statistik, distribusi gamma sering digunakan untuk memodelkan probabilitas terkait waktu tunggu. Kita dapat menggunakan fungsi berikut untuk bekerja dengan distribusi gamma di R: dgamma(x, bentuk, laju) – mencari nilai fungsi kerapatan distribusi gamma dengan parameter bentuk dan laju tertentu. pgamma(q,...
Distribusi binomial adalah distribusi probabilitas yang digunakan untuk memodelkan probabilitas sejumlah “keberhasilan” tertentu yang terjadi dalam sejumlah percobaan yang tetap. Distribusi binomial layak digunakan jika memenuhi tiga asumsi berikut: Asumsi 1: Setiap percobaan hanya memiliki dua kemungkinan hasil. Kami berasumsi bahwa...