Cara menggunakan plot qq untuk memeriksa normalitas


Plot QQ, kependekan dari “quantile-quantile,” digunakan untuk mengevaluasi apakah suatu kumpulan data berpotensi berasal dari distribusi teoretis.

Dalam kebanyakan kasus, jenis plot ini digunakan untuk menentukan apakah suatu kumpulan data mengikuti distribusi normal atau tidak.

Jika data berdistribusi normal, titik-titik pada plot QQ akan terletak pada garis lurus diagonal.

Sebaliknya, semakin signifikan titik-titik pada grafik menyimpang dari garis diagonal lurus, semakin kecil kemungkinan kumpulan data tersebut mengikuti distribusi normal.

Contoh berikut menunjukkan cara membuat plot QQ di R untuk memeriksa normalitas.

Contoh 1: Plot QQ untuk data normal

Kode berikut menunjukkan cara menghasilkan kumpulan data yang terdistribusi normal dengan 200 observasi dan membuat plot QQ untuk kumpulan data tersebut di R:

 #make this example reproducible
set. seeds (1)

#create some fake data that follows a normal distribution
data <- rnorm(200)

#create QQ plot
qqnorm(data)
qqline(data)

Kita dapat melihat bahwa titik-titik tersebut terutama terletak di sepanjang garis diagonal lurus dengan beberapa penyimpangan kecil di sepanjang masing-masing ekornya.

Berdasarkan grafik ini, kita dapat berasumsi bahwa kumpulan data ini terdistribusi normal.

Contoh 2: Plot QQ untuk data tidak normal

Kode berikut menunjukkan cara membuat plot QQ untuk kumpulan data yang mengikuti distribusi eksponensial dengan 200 observasi:

 #make this example reproducible
set. seeds (1)

#create some fake data that follows an exponential distribution
data <- rexp(200, rate=3)

#create QQ plot
qqnorm(data)
qqline(data)

Kita melihat bahwa titik-titiknya sangat menyimpang dari garis diagonal. Hal ini jelas menunjukkan bahwa dataset tidak berdistribusi normal.

Hal ini masuk akal mengingat kami menetapkan bahwa data harus mengikuti distribusi eksponensial.

Plot QQ dan histogram

Perlu dicatat bahwa plot QQ adalah cara untuk memeriksa secara visual apakah suatu kumpulan data mengikuti distribusi normal atau tidak.

Cara lain untuk memeriksa normalitas secara visual adalah dengan membuat histogram kumpulan data. Jika data kira-kira mengikuti bentuk kurva lonceng pada histogram, maka kita dapat berasumsi bahwa kumpulan data tersebut terdistribusi normal.

Misalnya, berikut cara membuat histogram untuk kumpulan data yang sebelumnya terdistribusi normal:

 #make this example reproducible
set. seeds (1)

#create some fake data that follows a normal distribution
data <- rnorm(200)

#create a histogram to visualize the distribution
hist(data) 

Dan berikut cara membuat histogram untuk dataset yang mengikuti distribusi prior eksponensial:

 #make this example reproducible
set. seeds (1)

#create some fake data that follows an exponential distribution
data <- rexp(200, rate=3)

#create a histogram to visualize the distribution
hist(data) 

Kita melihat bahwa histogram sama sekali tidak terlihat seperti kurva lonceng, yang secara jelas menunjukkan bahwa data tidak mengikuti distribusi normal.

Sumber daya tambahan

Apa asumsi normalitas dalam statistik?
Cara membuat plot QQ di R
Cara Membuat Plot QQ di Excel
Cara Membuat Plot QQ dengan Python

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *