Bagaimana menerapkan aturan praktis di r
Aturan praktisnya , terkadang disebut aturan 68-95-99.7, menyatakan bahwa untuk kumpulan data tertentu dengan distribusi normal:
- 68% nilai data berada dalam satu standar deviasi mean.
- 95% nilai data berada dalam dua standar deviasi dari mean.
- 99,7% nilai data berada dalam tiga standar deviasi mean.
Dalam tutorial ini, kami menjelaskan cara menerapkan aturan praktis di R ke kumpulan data tertentu.
Menerapkan aturan praktis di R
Fungsi pnorm() di R mengembalikan nilai fungsi kepadatan kumulatif dari distribusi normal.
Fungsi ini menggunakan sintaks dasar berikut:
pnorm(q, rata-rata, sd)
Emas:
- q : nilai variabel acak yang terdistribusi normal
- berarti : distribusi rata-rata
- sd : simpangan baku distribusi
Kita dapat menggunakan sintaks berikut untuk mencari luas di bawah kurva distribusi normal yang terletak di antara berbagai simpangan baku:
#find area under normal curve within 1 standard deviation of mean pnorm(1) - pnorm(-1) [1] 0.6826895 #find area under normal curve within 2 standard deviations of mean pnorm(2) - pnorm(-2) [1] 0.9544997 #find area under normal curve within 3 standard deviations of mean pnorm(3) - pnorm(-3) [1] 0.9973002
Dari hasilnya kami dapat mengkonfirmasi:
- 68% nilai data berada dalam satu standar deviasi mean.
- 95% nilai data berada dalam dua standar deviasi dari mean.
- 99,7% nilai data berada dalam tiga standar deviasi mean.
Contoh berikut menunjukkan cara menggunakan aturan praktis dengan kumpulan data yang berbeda dalam praktiknya.
Contoh 1: Menerapkan Aturan Empiris pada Kumpulan Data di R
Misalkan kita mempunyai kumpulan data yang berdistribusi normal dengan rata-rata 7 dan deviasi standar 2,2 .
Kita dapat menggunakan kode berikut untuk menentukan nilai mana yang berisi 68%, 95%, dan 99,7% data:
#define mean and standard deviation values mean=7 sd=2.2 #find which values contain 68% of data mean-2.2; mean+2.2 [1] 4.8 [1] 9.2 #find which values contain 95% of data mean-2*2.2; mean+2*2.2 [1] 2.6 [1] 11.4 #find which values contain 99.7% of data mean-3*2.2; mean+3*2.2 [1] 0.4 [1] 13.6
Dari keluaran ini kita dapat melihat:
- 68% data berada di antara 4,8 dan 9,2
- 95% data berada di antara 2,6 dan 11,4
- 99,7% data berkisar antara 0,4 dan 13,6
Contoh 2: Tentukan berapa persentase data yang berada di antara nilai-nilai tertentu
Bayangkan kita memiliki kumpulan data yang terdistribusi normal dengan rata-rata 100 dan deviasi standar 5.
Misalkan kita ingin mengetahui berapa persentase data yang berada di antara nilai 99 dan 105 dalam distribusi ini.
Kita dapat menggunakan fungsi pnorm( ) untuk menemukan jawabannya:
#find area under normal curve between 99 and 105
pnorm(105, mean=100, sd=5) - pnorm(99, mean=100, sd=5)
[1] 0.4206045
Kami melihat bahwa 42,06% data berada di antara nilai 99 dan 105 untuk distribusi ini.
Sumber daya tambahan
Bagaimana menerapkan aturan praktis di Excel
Masalah dalam mempraktikkan aturan praktis
Aturan Kalkulator Jempol