Cara menggunakan plot qq untuk memeriksa normalitas
Plot QQ, kependekan dari “quantile-quantile,” digunakan untuk mengevaluasi apakah suatu kumpulan data berpotensi berasal dari distribusi teoretis.
Dalam kebanyakan kasus, jenis plot ini digunakan untuk menentukan apakah suatu kumpulan data mengikuti distribusi normal atau tidak.
Jika data berdistribusi normal, titik-titik pada plot QQ akan terletak pada garis lurus diagonal.
Sebaliknya, semakin signifikan titik-titik pada grafik menyimpang dari garis diagonal lurus, semakin kecil kemungkinan kumpulan data tersebut mengikuti distribusi normal.
Contoh berikut menunjukkan cara membuat plot QQ di R untuk memeriksa normalitas.
Contoh 1: Plot QQ untuk data normal
Kode berikut menunjukkan cara menghasilkan kumpulan data yang terdistribusi normal dengan 200 observasi dan membuat plot QQ untuk kumpulan data tersebut di R:
#make this example reproducible set. seeds (1) #create some fake data that follows a normal distribution data <- rnorm(200) #create QQ plot qqnorm(data) qqline(data)
Kita dapat melihat bahwa titik-titik tersebut terutama terletak di sepanjang garis diagonal lurus dengan beberapa penyimpangan kecil di sepanjang masing-masing ekornya.
Berdasarkan grafik ini, kita dapat berasumsi bahwa kumpulan data ini terdistribusi normal.
Contoh 2: Plot QQ untuk data tidak normal
Kode berikut menunjukkan cara membuat plot QQ untuk kumpulan data yang mengikuti distribusi eksponensial dengan 200 observasi:
#make this example reproducible set. seeds (1) #create some fake data that follows an exponential distribution data <- rexp(200, rate=3) #create QQ plot qqnorm(data) qqline(data)
Kita melihat bahwa titik-titiknya sangat menyimpang dari garis diagonal. Hal ini jelas menunjukkan bahwa dataset tidak berdistribusi normal.
Hal ini masuk akal mengingat kami menetapkan bahwa data harus mengikuti distribusi eksponensial.
Plot QQ dan histogram
Perlu dicatat bahwa plot QQ adalah cara untuk memeriksa secara visual apakah suatu kumpulan data mengikuti distribusi normal atau tidak.
Cara lain untuk memeriksa normalitas secara visual adalah dengan membuat histogram kumpulan data. Jika data kira-kira mengikuti bentuk kurva lonceng pada histogram, maka kita dapat berasumsi bahwa kumpulan data tersebut terdistribusi normal.
Misalnya, berikut cara membuat histogram untuk kumpulan data yang sebelumnya terdistribusi normal:
#make this example reproducible set. seeds (1) #create some fake data that follows a normal distribution data <- rnorm(200) #create a histogram to visualize the distribution hist(data)
Dan berikut cara membuat histogram untuk dataset yang mengikuti distribusi prior eksponensial:
#make this example reproducible set. seeds (1) #create some fake data that follows an exponential distribution data <- rexp(200, rate=3) #create a histogram to visualize the distribution hist(data)
Kita melihat bahwa histogram sama sekali tidak terlihat seperti kurva lonceng, yang secara jelas menunjukkan bahwa data tidak mengikuti distribusi normal.
Sumber daya tambahan
Apa asumsi normalitas dalam statistik?
Cara membuat plot QQ di R
Cara Membuat Plot QQ di Excel
Cara Membuat Plot QQ dengan Python