Bagaimana menerapkan aturan praktis di r


Aturan praktisnya , terkadang disebut aturan 68-95-99.7, menyatakan bahwa untuk kumpulan data tertentu dengan distribusi normal:

  • 68% nilai data berada dalam satu standar deviasi mean.
  • 95% nilai data berada dalam dua standar deviasi dari mean.
  • 99,7% nilai data berada dalam tiga standar deviasi mean.

Dalam tutorial ini, kami menjelaskan cara menerapkan aturan praktis di R ke kumpulan data tertentu.

Menerapkan aturan praktis di R

Fungsi pnorm() di R mengembalikan nilai fungsi kepadatan kumulatif dari distribusi normal.

Fungsi ini menggunakan sintaks dasar berikut:

pnorm(q, rata-rata, sd)

Emas:

  • q : nilai variabel acak yang terdistribusi normal
  • berarti : distribusi rata-rata
  • sd : simpangan baku distribusi

Kita dapat menggunakan sintaks berikut untuk mencari luas di bawah kurva distribusi normal yang terletak di antara berbagai simpangan baku:

 #find area under normal curve within 1 standard deviation of mean
pnorm(1) - pnorm(-1)

[1] 0.6826895

#find area under normal curve within 2 standard deviations of mean 
pnorm(2) - pnorm(-2)

[1] 0.9544997

#find area under normal curve within 3 standard deviations of mean 
pnorm(3) - pnorm(-3)

[1] 0.9973002

Dari hasilnya kami dapat mengkonfirmasi:

  • 68% nilai data berada dalam satu standar deviasi mean.
  • 95% nilai data berada dalam dua standar deviasi dari mean.
  • 99,7% nilai data berada dalam tiga standar deviasi mean.

Contoh berikut menunjukkan cara menggunakan aturan praktis dengan kumpulan data yang berbeda dalam praktiknya.

Contoh 1: Menerapkan Aturan Empiris pada Kumpulan Data di R

Misalkan kita mempunyai kumpulan data yang berdistribusi normal dengan rata-rata 7 dan deviasi standar 2,2 .

Kita dapat menggunakan kode berikut untuk menentukan nilai mana yang berisi 68%, 95%, dan 99,7% data:

 #define mean and standard deviation values
mean=7
sd=2.2

#find which values contain 68% of data
mean-2.2; mean+2.2

[1] 4.8
[1] 9.2

#find which values contain 95% of data
mean-2*2.2; mean+2*2.2

[1] 2.6
[1] 11.4

#find which values contain 99.7% of data
mean-3*2.2; mean+3*2.2

[1] 0.4
[1] 13.6

Dari keluaran ini kita dapat melihat:

  • 68% data berada di antara 4,8 dan 9,2
  • 95% data berada di antara 2,6 dan 11,4
  • 99,7% data berkisar antara 0,4 dan 13,6

Contoh 2: Tentukan berapa persentase data yang berada di antara nilai-nilai tertentu

Bayangkan kita memiliki kumpulan data yang terdistribusi normal dengan rata-rata 100 dan deviasi standar 5.

Misalkan kita ingin mengetahui berapa persentase data yang berada di antara nilai 99 dan 105 dalam distribusi ini.

Kita dapat menggunakan fungsi pnorm( ) untuk menemukan jawabannya:

 #find area under normal curve between 99 and 105
pnorm(105, mean=100, sd=5) - pnorm(99, mean=100, sd=5)

[1] 0.4206045

Kami melihat bahwa 42,06% data berada di antara nilai 99 dan 105 untuk distribusi ini.

Sumber daya tambahan

Bagaimana menerapkan aturan praktis di Excel
Masalah dalam mempraktikkan aturan praktis
Aturan Kalkulator Jempol

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *