Cara menghitung residu standar di excel


Residual adalah selisih antara nilai observasi dan nilai prediksi dalam model regresi .

Ini dihitung sebagai berikut:

Sisa = Nilai yang diamati – Nilai yang diprediksi

Jika kita memplot nilai observasi dan menempatkan garis regresi yang dipasang, residu untuk setiap observasi akan menjadi jarak vertikal antara observasi dan garis regresi:

Contoh residu dalam statistik

Salah satu jenis residu yang sering kita gunakan untuk mengidentifikasi outlier dalam model regresi disebut residu terstandarisasi .

Ini dihitung sebagai berikut:

r i = e i / s( ei ) = e i / RSE√ 1-h ii

Emas:

  • e i : Residu ke -i
  • RSE: kesalahan standar sisa model
  • h ii : Meningkatnya observasi ke-i

Dalam praktiknya, kita sering menganggap residu terstandar yang nilai absolutnya lebih besar dari 3 sebagai outlier.

Tutorial ini memberikan contoh langkah demi langkah tentang cara menghitung residu standar di Excel.

Langkah 1: Masukkan datanya

Pertama, kita akan memasukkan nilai dari kumpulan data kecil ke dalam Excel:

Langkah 2: Hitung residu

Selanjutnya, kita akan menavigasi ke tab Data di sepanjang pita atas dan klik Analisis Data di grup Analisis :

Jika Anda belum menginstal add-in ini, lihat tutorial ini untuk mempelajari caranya. Sangat mudah untuk menginstal dan sepenuhnya gratis.

Setelah Anda mengklik Analisis Data, klik opsi yang bertuliskan Regresi , lalu klik OK . Di jendela baru yang muncul, isi informasi berikut dan klik OK :

Sisa tiap observasi akan muncul pada hasil:

Residu di Excel

Salin dan tempel sisa ini ke kolom baru di sebelah data asli:

Langkah 3: Hitung Leverage

Selanjutnya, kita perlu menghitung leverage dari setiap observasi.

Gambar berikut menunjukkan cara melakukan ini:

Memanfaatkan Perhitungan di Excel untuk Statistik

Berikut adalah rumus yang digunakan di sel yang berbeda:

  • B14: =JUMLAH(B2:B13)
  • B15: = RATA-RATA (B2: B13)
  • B16: =DEVSQ(B2:B13)
  • E2: =1/$B$14+(B2-$B$15)^2/$B$16

Langkah 4: Hitung residu standar

Terakhir, kita dapat menghitung residu terstandar menggunakan rumus:

r i = e i / RSE√ 1-jam ii

CSR model dapat dilihat pada hasil model sebelumnya. Ternyata menjadi 4,44 :

Oleh karena itu, kita dapat menggunakan rumus berikut untuk menghitung sisa terstandar untuk setiap observasi:

Residual terstandarisasi di Excel

Dari hasil tersebut, kita dapat melihat bahwa tidak ada satu pun residu terstandar yang melebihi nilai absolut 3. Dengan demikian, tidak ada satu pun observasi yang tampak outlier.

Perlu dicatat bahwa dalam beberapa kasus, peneliti menganggap observasi yang residu terstandarnya melebihi nilai absolut 2 sebagai outlier.

Terserah Anda apakah akan menggunakan nilai absolut 2 atau 3 sebagai ambang batas untuk outlier, bergantung pada masalah spesifik yang sedang Anda tangani.

Sumber daya tambahan

Apa itu residu?
Apa yang dimaksud dengan residu terstandar?
Pengantar Regresi Linier Berganda

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *