Cara menghitung jarak masak di sas


Jarak Cook digunakan untuk mengidentifikasi observasi yang berpengaruh dalam model regresi.

Rumus jarak Cook adalah:

d i = (r i 2 / p*MSE) * (h ii / (1-h ii ) 2 )

Emas:

  • r i adalah residu ke -i
  • p adalah jumlah koefisien dalam model regresi
  • MSE adalah kesalahan kuadrat rata-rata
  • h ii adalah nilai leverage ke-i

Pada dasarnya, jarak Cook mengukur seberapa besar semua nilai model yang dipasang berubah ketika pengamatan ke -i dihilangkan.

Semakin besar nilai jarak Cook maka semakin berpengaruh pula observasi yang diberikan.

Secara umum, setiap observasi dengan jarak Cook lebih besar dari 4/n (di mana n = total observasi) dianggap mempunyai pengaruh yang besar.

Contoh berikut menunjukkan cara menghitung jarak Cook untuk setiap observasi dalam model regresi di SAS.

Contoh: Menghitung jarak juru masak di SAS

Anggaplah kita memiliki kumpulan data berikut di SAS:

 /*create dataset*/
data my_data;
    input xy;
    datalines ;
8 41
12 42
12 39
13 37
14 35
16 39
17 45
22 46
24 39
26 49
29 55
30 57
;
run ;

/*view dataset*/
proc print data =my_data;

Kita dapat menggunakan PROC REG untuk menyesuaikan model regresi linier sederhana dengan kumpulan data ini, kemudian menggunakan pernyataan OUTPUT dengan pernyataan COOKD untuk menghitung jarak Cook untuk setiap observasi dalam model regresi:

 /*fit simple linear regression model and calculate Cook's distance for each obs*/
proc reg data =my_data;
    model y=x;
    output out=cooksData cookd =cookd;
run ;

/*print Cook's distance values for each observation*/
proc print data =cooksData;

Tabel hasil akhir menampilkan dataset asli beserta jarak Cook untuk setiap observasi:

Misalnya, kita dapat melihat:

  • Jarak Cook pada observasi pertama adalah 0,36813 .
  • Jarak Cook pada observasi kedua adalah 0,06075 .
  • Jarak Cook pada observasi ketiga adalah 0,00052 .

Dan seterusnya.

Prosedur PROC REG juga menghasilkan beberapa plot diagnostik pada outputnya dan plot jarak Cook dapat dilihat pada output berikut:

Jarak masak di SAS

Sumbu x menunjukkan jumlah observasi dan sumbu y menunjukkan jarak Cook untuk setiap observasi.

Perhatikan bahwa garis batas ditempatkan pada 4/n (dalam hal ini n = 12, sehingga batasnya berada pada 0,33) dan kita dapat melihat bahwa tiga observasi dalam kumpulan data lebih besar dari garis ini.

Hal ini menunjukkan bahwa observasi ini dapat mempunyai pengaruh yang besar terhadap model regresi dan mungkin harus diperiksa lebih dekat sebelum menginterpretasikan hasil model.

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di SAS:

Cara Membuat Plot Sisa di SAS
Cara Membuat Histogram di SAS
Cara membuat point cloud di SAS
Cara mengidentifikasi outlier di SAS

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *