Cara membuat dan menafsirkan plot qq di stata
Plot QQ , kependekan dari “quantile-quantile”, sering digunakan untuk mengevaluasi apakah residu dari analisis regresi berdistribusi normal atau tidak.
Tutorial ini menjelaskan cara membuat dan menafsirkan plot QQ di Stata.
Contoh: plot QQ di Stata
Untuk contoh ini, kita akan menggunakan kumpulan data otomatis yang ada di dalam Stata. Kami akan menggunakan model regresi linier berganda, menggunakan mpg dan perpindahan sebagai variabel penjelas dan harga sebagai variabel respon. Kami kemudian akan memperoleh residu untuk model dan membuat plot QQ untuk melihat apakah residu mengikuti distribusi normal.
Langkah 1: Muat dan tampilkan data.
Pertama, kita akan memuat data menggunakan perintah berikut:
penggunaan otomatis sistem
Selanjutnya, kita akan mendapatkan ringkasan singkat data menggunakan perintah berikut:
untuk meringkas
Langkah 2: Sesuaikan model regresi.
Selanjutnya, kita akan menggunakan perintah berikut untuk menyesuaikan model regresi:
perpindahan harga mpg regresi
Langkah 3: Hitung residunya .
Ingatlah bahwa residu hanyalah selisih antara nilai respons yang diprediksi (yang dihitung dengan persamaan regresi estimasi) dan nilai respons aktual.
Kita bisa mendapatkan sisa dari setiap prediksi dengan menggunakan perintah sisa dan menyimpan nilai tersebut dalam variabel dengan nama apapun yang kita inginkan. Dalam hal ini, kita akan menggunakan nama resid_price :
prediksi harga_residensi, sisa
Langkah 4: Buat plot QQ.
Sekarang kita memiliki daftar residu, kita dapat membuat plot QQ menggunakan perintah qnorm :
qnorm harga_resid
Langkah 5: Tafsirkan plot QQ.
Ide di balik plot QQ sederhana: jika residu mengikuti garis lurus pada sudut 45 derajat, maka residu terdistribusi secara normal. Kita dapat melihat pada plot QQ di atas bahwa residu cenderung sedikit menyimpang dari garis 45 derajat, terutama di bagian ujungnya, yang dapat menunjukkan bahwa residu tersebut tidak berdistribusi normal.
Meskipun plot QQ bukan merupakan uji statistik formal, plot ini menyediakan cara sederhana untuk memeriksa secara visual apakah residu terdistribusi normal atau tidak.
Jika ternyata residu Anda menyimpang secara signifikan dari garis 45 derajat pada plot QQ, Anda mungkin mempertimbangkan untuk melakukan transformasi pada variabel respon dalam regresi Anda, misalnya menggunakan akar kuadrat atau log dari variabel respon.
Jika residu hanya menyimpang sedikit, Anda tidak perlu khawatir untuk mentransformasikan variabel respon, karena regresi cukup kuat terhadap penyimpangan dari normalitas.