Cara menghitung desil di r (beserta contoh)


Dalam statistik, desil adalah angka yang membagi kumpulan data menjadi sepuluh kelompok dengan frekuensi yang sama.

Desil pertama adalah titik di mana 10% dari seluruh nilai data berada di bawahnya. Desil kedua adalah titik di mana 20% dari seluruh nilai data berada di bawahnya, dan seterusnya.

Kita dapat menggunakan sintaks berikut untuk menghitung desil suatu dataset di R:

 quantile(data, probs = seq (.1, .9, by = .1 ))

Contoh berikut menunjukkan cara menggunakan fungsi ini dalam praktiknya.

Contoh: menghitung desil di R

Kode berikut menunjukkan cara membuat dataset palsu dengan 20 nilai dan kemudian menghitung nilai desil dari dataset tersebut:

 #create dataset
data <- c(56, 58, 64, 67, 68, 73, 78, 83, 84, 88,
          89, 90, 91, 92, 93, 93, 94, 95, 97, 99)

#calculate deciles of dataset
quantile(data, probs = seq (.1, .9, by = .1 ))

 10% 20% 30% 40% 50% 60% 70% 80% 90% 
63.4 67.8 76.5 83.6 88.5 90.4 92.3 93.2 95.2 

Cara menafsirkan desil adalah sebagai berikut:

  • 10% dari seluruh nilai data kurang dari 63,4
  • 20% dari seluruh nilai data kurang dari 67,8 .
  • 30% dari seluruh nilai data kurang dari 76,5 .
  • 40% dari seluruh nilai data kurang dari 83,6 .
  • 50% dari seluruh nilai data kurang dari 88,5 .
  • 60% dari seluruh nilai data kurang dari 90,4 .
  • 70% dari seluruh nilai data kurang dari 92,3 .
  • 80% dari seluruh nilai data kurang dari 93,2 .
  • 90% dari seluruh nilai data kurang dari 95,2 .

Perlu diperhatikan bahwa nilai pada persentil ke-50 sama dengan nilai median kumpulan data.

Contoh: menempatkan nilai dalam desil di R

Untuk menempatkan setiap nilai data dalam satu desil, kita dapat menggunakan fungsi ntile(x, ngroups) dari paket dplyr di R.

Berikut cara menggunakan fungsi ini untuk dataset yang kita buat pada contoh sebelumnya:

 library (dplyr)

#create dataset
data <- data.frame(values=c(56, 58, 64, 67, 68, 73, 78, 83, 84, 88,
                            89, 90, 91, 92, 93, 93, 94, 95, 97, 99))

#place each value into a decile
data$decile <- ntile(data, 10)

#viewdata
data

   values decile
1 56 1
2 58 1
3 64 2
4 67 2
5 68 3
6 73 3
7 78 4
8 83 4
9 84 5
10 88 5
11 89 6
12 90 6
13 91 7
14 92 7
15 93 8
16 93 8
17 94 9
18 95 9
19 97 10
20 99 10

Cara menafsirkan hasilnya adalah sebagai berikut:

  • Nilai data 56 berada di antara persentil 0% dan 10% sehingga berada pada desil pertama.
  • Nilai data 58 berada di antara persentil 0% dan 10% sehingga berada pada desil pertama.
  • Nilai data 64 berada di antara persentil 10% dan 20% sehingga berada pada desil kedua.
  • Nilai data 67 berada di antara persentil 10% dan 20% sehingga berada pada desil kedua.
  • Nilai data 68 berada di antara persentil 20% dan 30% sehingga berada pada desil ketiga.

Dan seterusnya.

Sumber daya tambahan

Cara menghitung persentil di R
Cara menghitung kuartil di R
Cara membuat tabel frekuensi di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *