Cara membuat plot qq di sas


Plot QQ, kependekan dari “quantile-quantile,” digunakan untuk mengevaluasi apakah suatu kumpulan data berpotensi berasal dari distribusi teoretis.

Dalam kebanyakan kasus, jenis plot ini digunakan untuk menentukan apakah suatu kumpulan data mengikuti distribusi normal atau tidak.

Jika data berdistribusi normal, titik-titik pada plot QQ akan terletak pada garis lurus diagonal.

Sebaliknya, semakin signifikan titik-titik pada grafik menyimpang dari garis diagonal lurus, semakin kecil kemungkinan kumpulan data tersebut mengikuti distribusi normal.

Cara termudah untuk membuat plot QQ di SAS adalah dengan menggunakan pernyataan PROC UNIVARIATE dengan pernyataan QQPLOT :

 proc univariate data =my_data noprint ;
   qqplot my_variable;
run ;

Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.

Catatan : Kami menggunakan pernyataan NOPRINT untuk menghapus semua statistik ringkasan dan tabel lainnya yang secara otomatis dihasilkan oleh pernyataan PROC UNIVARIATE .

Contoh 1: Buat plot QQ di SAS untuk data normal

Kode berikut menunjukkan cara membuat plot QQ untuk kumpulan data yang berisi 1000 observasi yang dihasilkan dari distribusi normal dengan mean 10 dan standar deviasi 2:

 /*generate 1000 values that follow normal distribution with mean 10 and sd 2 */
data normal_data;
    do i = 1 to 1000;
	x = 10 + 2* rannor (1);
        output ;
    end ;
run ;

/*create some plot*/
proc univariate data =normal_data noprint ;
   qqplot x;
run ; 

Plot QQ di SAS

Kita dapat melihat bahwa titik-titik tersebut sebagian besar terletak di sepanjang garis diagonal lurus dengan sedikit penyimpangan di sepanjang masing-masing ekornya.

Berdasarkan grafik ini, kita dapat berasumsi bahwa kumpulan data ini terdistribusi normal.

Contoh 2: Plot QQ untuk data tidak normal

Kode berikut menunjukkan cara membuat plot QQ untuk dataset yang berisi 1000 observasi yang dihasilkan dari distribusi eksponensial :

 /*generate 1000 values that follow an exponential distribution*/
data exp_data;
    do i = 1 to 1000;
	x = ranexp (1);
        output ;
    end ;
run ;

/*create some plot*/
proc univariate data =exp_data noprint ;
   qqplot x;
run ; 

Saya melihat titik-titik tersebut menyimpang secara signifikan dari garis diagonal lurus. Hal ini jelas menunjukkan bahwa dataset tidak berdistribusi normal.

Hal ini masuk akal mengingat kami menetapkan bahwa data harus mengikuti distribusi eksponensial.

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di SAS:

Cara Menggunakan Proc Univariate untuk Pengujian Normalitas di SAS
Cara melakukan transformasi log di SAS
Cara mengidentifikasi outlier di SAS

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *