Dua istilah yang sering membingungkan siswa dalam statistik adalah kesalahan standar dan margin kesalahan . Kesalahan standar mengukur ketepatan perkiraan rata-rata populasi. Ini dihitung sebagai berikut: Kesalahan standar = s / √n Emas: s: deviasi standar sampel n: ukuran sampel Margin...
Plot berpasangan adalah matriks scatterplot yang memungkinkan Anda memahami hubungan berpasangan antara variabel berbeda dalam kumpulan data. Untungnya, mudah untuk membuat plot berpasangan di R menggunakan fungsi pair() . Tutorial ini memberikan beberapa contoh penggunaan praktis fungsi ini. Contoh 1: Plot...
Distribusi binomial menggambarkan probabilitas diperolehnya k keberhasilan dalam n percobaan binomial. Jika suatu variabel acak X mengikuti distribusi binomial, maka peluang keberhasilan X = k dapat dicari dengan rumus berikut: P(X=k) = n C k * p k * (1-p) nk...
Variabel penyerta (kadang-kadang disebut “kovariat”) adalah variabel yang bukan merupakan kepentingan utama dalam suatu penelitian, namun mungkin mempunyai interaksi dengan variabel-variabel yang diteliti. Kegagalan memperhitungkan jenis variabel ini dapat menyebabkan hasil analisis yang bias atau menyesatkan. Oleh karena itu penting untuk...
Frekuensi relatif mengukur seberapa sering nilai tertentu muncul dalam kumpulan data relatif terhadap jumlah total nilai dalam kumpulan data. Anda dapat menggunakan fungsi berikut dengan Python untuk menghitung frekuensi relatif: def rel_freq (x): freqs = [(value, x.count(value) / len(x)) for value...
Interval kepercayaan adalah rentang nilai yang kemungkinan memuat parameter populasi dengan tingkat kepercayaan tertentu. Tutorial ini menjelaskan cara memplot interval kepercayaan untuk kumpulan data di R. Contoh: memplot interval kepercayaan di R Misalkan kita memiliki dataset berikut di R dengan 100...
Seringkali, saat melakukan regresi linier sederhana, Anda mungkin ingin membuat diagram sebar untuk memvisualisasikan berbagai kombinasi nilai x dan y serta perkiraan garis regresi. Untungnya, ada dua cara mudah untuk membuat plot jenis ini dengan Python. Tutorial ini menjelaskan kedua metode...
Bagan batang dan daun adalah bagan yang menampilkan data dengan membagi setiap nilai dalam kumpulan data menjadi batang dan daun . Ini adalah plot yang unik karena membantu kita memvisualisasikan bentuk distribusi sambil menampilkan nilai mentah dari masing-masing data. Tutorial ini...
Seringkali, Anda mungkin ingin menyusun baris bingkai data di R dalam urutan tertentu. Untungnya, hal ini mudah dilakukan dengan menggunakan fungsi arrange() dari perpustakaan dplyr . Tutorial ini menjelaskan beberapa contoh penggunaan praktis fungsi ini menggunakan bingkai data berikut: #create data...
Seringkali Anda mungkin tertarik untuk menghitung jumlah observasi per grup di R. Untungnya, hal ini mudah dilakukan dengan menggunakan fungsi count() pada perpustakaan dplyr . Tutorial ini menjelaskan beberapa contoh penggunaan praktis fungsi ini menggunakan bingkai data berikut: #create data frame...