{"id":508,"date":"2023-07-29T16:29:54","date_gmt":"2023-07-29T16:29:54","guid":{"rendered":"https:\/\/statorials.org\/id\/cara-mengidentifikasi-titik-data-yang-berpengaruh-menggunakan-jarak-juru-masak\/"},"modified":"2023-07-29T16:29:54","modified_gmt":"2023-07-29T16:29:54","slug":"cara-mengidentifikasi-titik-data-yang-berpengaruh-menggunakan-jarak-juru-masak","status":"publish","type":"post","link":"https:\/\/statorials.org\/id\/cara-mengidentifikasi-titik-data-yang-berpengaruh-menggunakan-jarak-juru-masak\/","title":{"rendered":"Cara mengidentifikasi titik data yang berpengaruh menggunakan jarak cook"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\"><strong>Jarak Cook<\/strong> , sering dilambangkan dengan D <sub>i<\/sub> , digunakan dalam <a href=\"https:\/\/statorials.org\/id\/regresi-linier-berganda\/\" target=\"_blank\" rel=\"noopener noreferrer\">analisis regresi<\/a> untuk mengidentifikasi titik data berpengaruh yang mungkin berdampak negatif pada model regresi Anda.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Rumus jarak Cook adalah:<\/span><\/p>\n<p style=\"text-align: center;\"> <span style=\"color: #000000;\"><strong>d <sub>i<\/sub><\/strong> = (r <sub>i<\/sub> <sup>2<\/sup> \/ p*MSE) * (h <sub>ii<\/sub> \/ (1-h <sub>ii<\/sub> ) <sup>2<\/sup> )<\/span><\/p>\n<p> <span style=\"color: #000000;\">Emas:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\"><strong>r<\/strong> <sub><strong>i<\/strong><\/sub> adalah residu <sup>ke<\/sup> -i<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>p<\/strong> adalah jumlah koefisien dalam model regresi<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>MSE<\/strong> adalah kesalahan kuadrat rata-rata<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>h<\/strong> <sub>ii<\/sub> adalah nilai leverage <sup>ke-i<\/sup><\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Meskipun rumusnya tampak agak rumit, kabar baiknya adalah sebagian besar perangkat lunak statistik dapat menghitungnya dengan mudah untuk Anda.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Pada dasarnya, jarak Cook melakukan satu hal: <strong>mengukur seberapa besar perubahan semua nilai model yang dipasang ketika titik data <sup>ke<\/sup> -i dihapus.<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Titik data yang memiliki nilai jarak Cook yang tinggi menunjukkan bahwa hal tersebut sangat mempengaruhi nilai yang dipasang. Aturan umumnya adalah setiap titik dengan jarak Cook lebih besar dari 4\/n ( <em>dengan n adalah jumlah total titik data<\/em> ) dianggap outlier.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Penting untuk diperhatikan bahwa jarak Cook sering digunakan untuk <em>mengidentifikasi<\/em> titik data yang berpengaruh. Hanya karena suatu titik data berpengaruh bukan berarti titik data tersebut harus dihapus. Anda harus terlebih dahulu memeriksa apakah titik data dicatat secara tidak benar atau ada sesuatu yang aneh pada titik data yang dapat menunjukkan temuan menarik.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Cara menghitung jarak Cook di R<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Contoh berikut mengilustrasikan cara menghitung jarak Cook di R.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Pertama, kita akan memuat dua perpustakaan yang kita perlukan untuk contoh ini:<\/span><\/p>\n<pre style=\"background-color: #e5e5e5; font-size: 15px;\"> <strong>library(ggplot2)\nlibrary(gridExtra)<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Selanjutnya, kita akan mendefinisikan dua bingkai data: satu dengan dua outlier dan satu lagi tanpa outlier.<\/span><\/p>\n<pre style=\"background-color: #e5e5e5; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#create data frame with no outliers<\/span>\nno_outliers &lt;- data.frame(x = c(1, 2, 2, 3, 4, 5, 7, 3, 2, 12, 11, 15, 14, 17, 22),\n                          y = c(22, 23, 24, 23, 19, 34, 35, 36, 36, 34, 32, 38, 41,\n                                42, 44))\n\n<span style=\"color: #008080;\">#create data frame with two outliers\n<\/span>outliers &lt;- data.frame(x = c(1, 2, 2, 3, 4, 5, 7, 3, 2, 12, 11, 15, 14, 17, 22),\n                       y = c( <span style=\"color: #800080;\">190<\/span> , 23, 24, 23, 19, 34, 35, 36, 36, 34, 32, 38, 41,\n                             42, <span style=\"color: #800080;\">180<\/span> ))<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Selanjutnya, kita akan membuat plot sebar untuk menampilkan dua bingkai data secara berdampingan:<\/span><\/p>\n<pre style=\"background-color: #e5e5e5; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#create scatterplot for data frame with no outliers\n<\/span>no_outliers_plot &lt;- ggplot(data = no_outliers, aes(x = x, y = y)) +\n  geom_point() +\n  geom_smooth(method = lm) +\n  ylim(0, 200) +\n  ggtitle(\"No Outliers\")\n\n<span style=\"color: #008080;\">#create scatterplot for data frame with outliers\n<\/span>outliers_plot &lt;- ggplot(data = outliers, aes(x = x, y = y)) +\n  geom_point() +\n  geom_smooth(method = lm) +\n  ylim(0, 200) +\n  ggtitle(\"With Outliers\")\n\n<span style=\"color: #008080;\">#plot the two scatterplots side by side\n<\/span>gridExtra::grid.arrange(no_outliers_plot, outliers_plot, ncol=2)<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Kita dapat melihat bagaimana outlier mempengaruhi kesesuaian garis regresi secara negatif pada grafik kedua.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Untuk mengidentifikasi titik-titik berpengaruh dalam kumpulan data kedua, kita dapat menghitung <strong>jarak Cook<\/strong> untuk setiap observasi dalam kumpulan data dan kemudian memplot jarak ini untuk melihat observasi mana yang berada di atas ambang batas tradisional 4\/n:<\/span><\/p>\n<pre style=\"background-color: #e5e5e5; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#fit the linear regression model to the dataset with outliers<\/span>\nmodel &lt;- lm(y ~ x, data = outliers)\n\n<span style=\"color: #008080;\">#find Cook's distance for each observation in the dataset\n<\/span>cooksD &lt;- cooks.distance(model)\n\n<span style=\"color: #008080;\"># Plot Cook's Distance with a horizontal line at 4\/n to see which observations<\/span>\n<span style=\"color: #008080;\">#exceed this threshold<\/span>\nn &lt;- nrow(outliers)\nplot(cooksD, main = \"Cooks Distance for Influential Obs\")\nabline(h = 4\/n, lty = 2, col = \"steelblue\") <span style=\"color: #008080;\"># add cutoff line<\/span><\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Kita dapat melihat dengan jelas bahwa observasi pertama dan terakhir dalam kumpulan data melebihi ambang batas 4\/n. Oleh karena itu, kami akan mengidentifikasi kedua observasi ini sebagai titik data berpengaruh yang berdampak negatif pada model regresi.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Jika kita ingin menghapus semua observasi yang melebihi ambang batas 4\/n, kita dapat melakukannya menggunakan kode berikut:<\/span><\/p>\n<pre style=\"background-color: #e5e5e5; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#identify influential points<\/span>\ninfluential_obs &lt;- as.numeric(names(cooksD)[(cooksD &gt; (4\/n))])\n\n<span style=\"color: #008080;\">#define new data frame with influential points removed\n<\/span>outliers_removed &lt;- outliers[-influential_obs, ]<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Kemudian kita dapat membandingkan dua plot sebar: satu menunjukkan garis regresi dengan adanya titik pengaruh dan yang lainnya menunjukkan garis regresi dengan titik pengaruh dihilangkan:<\/span><\/p>\n<pre style=\"background-color: #e5e5e5; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#create scatterplot with outliers present<\/span>\noutliers_present &lt;- ggplot(data = outliers, aes(x = x, y = y)) +\n  geom_point() +\n  geom_smooth(method = lm) +\n  ylim(0, 200) +\n  ggtitle(\"Outliers Present\")\n\n<span style=\"color: #008080;\">#create scatterplot with outliers removed<\/span>\noutliers_removed &lt;- ggplot(data = outliers_removed, aes(x = x, y = y)) +\n  geom_point() +\n  geom_smooth(method = lm) +\n  ylim(0, 200) +\n  ggtitle(\"Outliers Removed\")\n\n<span style=\"color: #008080;\">#plot both scatterplots side by side\n<\/span>gridExtra::grid.arrange(outliers_present, outliers_removed, ncol = 2)<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Kita dapat melihat dengan jelas seberapa cocok garis regresi dengan data setelah dua titik data yang berpengaruh dihilangkan.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Catatan teknis<\/strong><\/span><\/h3>\n<ul>\n<li> <span style=\"color: #000000;\">Sebagian besar perangkat lunak statistik memiliki kemampuan untuk menghitung jarak Cook dengan mudah untuk setiap observasi dalam kumpulan data.<\/span><\/li>\n<li> <span style=\"color: #000000;\">Ingatlah bahwa Jarak Cook hanyalah sebuah cara untuk <em>mengidentifikasi<\/em> titik-titik pengaruh.<\/span><\/li>\n<li> <span style=\"color: #000000;\">Ada banyak cara untuk <em>menangani<\/em> titik-titik yang berpengaruh, termasuk: menghilangkan titik-titik tersebut, mengganti titik-titik tersebut dengan nilai seperti mean atau median, atau sekadar mempertahankan titik-titik tersebut dalam model namun mencatatnya dengan cermat saat melaporkan hasil regresi.<\/span><\/li>\n<\/ul>\n","protected":false},"excerpt":{"rendered":"<p>Jarak Cook , sering dilambangkan dengan D i , digunakan dalam analisis regresi untuk mengidentifikasi titik data berpengaruh yang mungkin berdampak negatif pada model regresi Anda. Rumus jarak Cook adalah: d i = (r i 2 \/ p*MSE) * (h ii \/ (1-h ii ) 2 ) Emas: r i adalah residu ke -i p [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Cara Mengidentifikasi Titik Data yang Berpengaruh Menggunakan Jarak Cook - Statologi<\/title>\n<meta name=\"description\" content=\"Tutorial ini menjelaskan cara mengidentifikasi titik data yang berpengaruh dalam analisis regresi menggunakan jarak Cook.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/id\/cara-mengidentifikasi-titik-data-yang-berpengaruh-menggunakan-jarak-juru-masak\/\" \/>\n<meta property=\"og:locale\" content=\"id_ID\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Cara Mengidentifikasi Titik Data yang Berpengaruh Menggunakan Jarak Cook - Statologi\" \/>\n<meta property=\"og:description\" content=\"Tutorial ini menjelaskan cara mengidentifikasi titik data yang berpengaruh dalam analisis regresi menggunakan jarak Cook.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/id\/cara-mengidentifikasi-titik-data-yang-berpengaruh-menggunakan-jarak-juru-masak\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-29T16:29:54+00:00\" \/>\n<meta name=\"author\" content=\"Benjamin anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Ditulis oleh\" \/>\n\t<meta name=\"twitter:data1\" content=\"Benjamin anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Estimasi waktu membaca\" \/>\n\t<meta name=\"twitter:data2\" content=\"4 menit\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/id\/cara-mengidentifikasi-titik-data-yang-berpengaruh-menggunakan-jarak-juru-masak\/\",\"url\":\"https:\/\/statorials.org\/id\/cara-mengidentifikasi-titik-data-yang-berpengaruh-menggunakan-jarak-juru-masak\/\",\"name\":\"Cara Mengidentifikasi Titik Data yang Berpengaruh Menggunakan Jarak Cook - Statologi\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/id\/#website\"},\"datePublished\":\"2023-07-29T16:29:54+00:00\",\"dateModified\":\"2023-07-29T16:29:54+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/id\/#\/schema\/person\/3d17a1160dd2d052b7c78e502cb9ec81\"},\"description\":\"Tutorial ini menjelaskan cara mengidentifikasi titik data yang berpengaruh dalam analisis regresi menggunakan jarak Cook.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/id\/cara-mengidentifikasi-titik-data-yang-berpengaruh-menggunakan-jarak-juru-masak\/#breadcrumb\"},\"inLanguage\":\"id\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/id\/cara-mengidentifikasi-titik-data-yang-berpengaruh-menggunakan-jarak-juru-masak\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/id\/cara-mengidentifikasi-titik-data-yang-berpengaruh-menggunakan-jarak-juru-masak\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\/\/statorials.org\/id\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Cara mengidentifikasi titik data yang berpengaruh menggunakan jarak cook\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/id\/#website\",\"url\":\"https:\/\/statorials.org\/id\/\",\"name\":\"Statorials\",\"description\":\"Panduan anda untuk kompetensi statistik!\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/id\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"id\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/id\/#\/schema\/person\/3d17a1160dd2d052b7c78e502cb9ec81\",\"name\":\"Benjamin anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"id\",\"@id\":\"https:\/\/statorials.org\/id\/#\/schema\/person\/image\/\",\"url\":\"http:\/\/statorials.org\/id\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"http:\/\/statorials.org\/id\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"caption\":\"Benjamin anderson\"},\"description\":\"Halo, saya Benjamin, pensiunan profesor statistika yang menjadi guru Statorial yang berdedikasi. Dengan pengalaman dan keahlian yang luas di bidang statistika, saya ingin berbagi ilmu untuk memberdayakan mahasiswa melalui Statorials. Baca selengkapnya\",\"sameAs\":[\"http:\/\/statorials.org\/id\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Cara Mengidentifikasi Titik Data yang Berpengaruh Menggunakan Jarak Cook - Statologi","description":"Tutorial ini menjelaskan cara mengidentifikasi titik data yang berpengaruh dalam analisis regresi menggunakan jarak Cook.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/id\/cara-mengidentifikasi-titik-data-yang-berpengaruh-menggunakan-jarak-juru-masak\/","og_locale":"id_ID","og_type":"article","og_title":"Cara Mengidentifikasi Titik Data yang Berpengaruh Menggunakan Jarak Cook - Statologi","og_description":"Tutorial ini menjelaskan cara mengidentifikasi titik data yang berpengaruh dalam analisis regresi menggunakan jarak Cook.","og_url":"https:\/\/statorials.org\/id\/cara-mengidentifikasi-titik-data-yang-berpengaruh-menggunakan-jarak-juru-masak\/","og_site_name":"Statorials","article_published_time":"2023-07-29T16:29:54+00:00","author":"Benjamin anderson","twitter_card":"summary_large_image","twitter_misc":{"Ditulis oleh":"Benjamin anderson","Estimasi waktu membaca":"4 menit"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/id\/cara-mengidentifikasi-titik-data-yang-berpengaruh-menggunakan-jarak-juru-masak\/","url":"https:\/\/statorials.org\/id\/cara-mengidentifikasi-titik-data-yang-berpengaruh-menggunakan-jarak-juru-masak\/","name":"Cara Mengidentifikasi Titik Data yang Berpengaruh Menggunakan Jarak Cook - Statologi","isPartOf":{"@id":"https:\/\/statorials.org\/id\/#website"},"datePublished":"2023-07-29T16:29:54+00:00","dateModified":"2023-07-29T16:29:54+00:00","author":{"@id":"https:\/\/statorials.org\/id\/#\/schema\/person\/3d17a1160dd2d052b7c78e502cb9ec81"},"description":"Tutorial ini menjelaskan cara mengidentifikasi titik data yang berpengaruh dalam analisis regresi menggunakan jarak Cook.","breadcrumb":{"@id":"https:\/\/statorials.org\/id\/cara-mengidentifikasi-titik-data-yang-berpengaruh-menggunakan-jarak-juru-masak\/#breadcrumb"},"inLanguage":"id","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/id\/cara-mengidentifikasi-titik-data-yang-berpengaruh-menggunakan-jarak-juru-masak\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/id\/cara-mengidentifikasi-titik-data-yang-berpengaruh-menggunakan-jarak-juru-masak\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/statorials.org\/id\/"},{"@type":"ListItem","position":2,"name":"Cara mengidentifikasi titik data yang berpengaruh menggunakan jarak cook"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/id\/#website","url":"https:\/\/statorials.org\/id\/","name":"Statorials","description":"Panduan anda untuk kompetensi statistik!","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/id\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"id"},{"@type":"Person","@id":"https:\/\/statorials.org\/id\/#\/schema\/person\/3d17a1160dd2d052b7c78e502cb9ec81","name":"Benjamin anderson","image":{"@type":"ImageObject","inLanguage":"id","@id":"https:\/\/statorials.org\/id\/#\/schema\/person\/image\/","url":"http:\/\/statorials.org\/id\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","contentUrl":"http:\/\/statorials.org\/id\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","caption":"Benjamin anderson"},"description":"Halo, saya Benjamin, pensiunan profesor statistika yang menjadi guru Statorial yang berdedikasi. Dengan pengalaman dan keahlian yang luas di bidang statistika, saya ingin berbagi ilmu untuk memberdayakan mahasiswa melalui Statorials. Baca selengkapnya","sameAs":["http:\/\/statorials.org\/id"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/posts\/508"}],"collection":[{"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/comments?post=508"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/posts\/508\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/media?parent=508"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/categories?post=508"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/tags?post=508"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}