{"id":917,"date":"2023-07-28T08:02:55","date_gmt":"2023-07-28T08:02:55","guid":{"rendered":"https:\/\/statorials.org\/id\/menghapus-outlier-r\/"},"modified":"2023-07-28T08:02:55","modified_gmt":"2023-07-28T08:02:55","slug":"menghapus-outlier-r","status":"publish","type":"post","link":"https:\/\/statorials.org\/id\/menghapus-outlier-r\/","title":{"rendered":"Cara menghilangkan outlier di r"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\"><strong>Outlier<\/strong> adalah observasi yang jaraknya sangat jauh dari nilai lain dalam kumpulan data. Pencilan dapat menjadi masalah karena dapat mempengaruhi hasil analisis.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Tutorial ini menjelaskan cara mengidentifikasi dan menghapus outlier di R.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Bagaimana mengidentifikasi outlier di R<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Sebelum Anda dapat menghapus outlier, Anda harus terlebih dahulu memutuskan apa yang Anda anggap sebagai outlier. Ada dua cara umum untuk melakukan ini:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>1. Gunakan rentang interkuartil.<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Rentang interkuartil (IQR) adalah selisih antara persentil ke-75 (Q3) dan persentil ke-25 (Q1) dalam suatu kumpulan data. Ini mengukur distribusi rata-rata 50% nilai.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Anda dapat mendefinisikan suatu observasi sebagai outlier jika observasi tersebut 1,5 kali rentang antarkuartil di atas kuartil ketiga (Q3) atau 1,5 kali rentang antarkuartil di bawah kuartil pertama (Q1).<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Outlier = Pengamatan &gt; Q3 + 1,5*IQR atau &lt; Q1 \u2013 1,5*IQR<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>2. Gunakan skor-z.<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\"><a href=\"https:\/\/statorials.org\/id\/skor-zr\/\" target=\"_blank\" rel=\"noopener noreferrer\">Skor-z<\/a> memberi tahu Anda berapa banyak deviasi standar suatu nilai tertentu dari mean. Kami menggunakan rumus berikut untuk menghitung skor-z:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>z<\/strong> = (X \u2013 \u03bc) \/ \u03c3<\/span><\/p>\n<p> <span style=\"color: #000000;\">Emas:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">X adalah nilai data mentah tunggal<\/span><\/li>\n<li> <span style=\"color: #000000;\">\u03bc adalah rata-rata populasi<\/span><\/li>\n<li> <span style=\"color: #000000;\">\u03c3 adalah simpangan baku populasi<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Anda dapat mendefinisikan suatu observasi sebagai outlier jika skor z-nya kurang dari -3 atau lebih besar dari 3.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Pencilan = Pengamatan dengan skor z &gt; 3 atau &lt; -3<\/strong><\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Cara menghilangkan outlier di R<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Setelah Anda memutuskan apa yang Anda anggap sebagai outlier, Anda kemudian dapat mengidentifikasi dan menghapusnya dari kumpulan data. Untuk mengilustrasikan cara melakukan ini, kami akan menggunakan kerangka data berikut:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#make this example reproducible<\/span> \nset.seed(0)\n\n<span style=\"color: #008080;\">#create data frame with three columns A', 'B', 'C'<\/span> \ndf &lt;- data.frame(A=rnorm(1000, mean=10, sd=3),\n                 B=rnorm(1000, mean=20, sd=3),\n                 C=rnorm(1000, mean=30, sd=3))\n\n<span style=\"color: #008080;\">#view first six rows of data frame<\/span>\nhead(df)\n         ABC\n1 13.78886 19.13945 31.33304\n2 9.02130 25.52332 30.03579\n3 13.98940 19.52971 29.97216\n4 13.81729 15.83059 29.09287\n5 11.24392 15.58069 31.47707\n6 5.38015 19.79144 28.19184\n<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Kita kemudian dapat mendefinisikan dan menghilangkan outlier menggunakan metode z-score atau metode rentang interkuartil:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Metode skor Z:<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Kode berikut menunjukkan cara menghitung skor-z dari setiap nilai di setiap kolom bingkai data dan kemudian menghapus baris yang memiliki setidaknya satu skor-z dengan nilai absolut lebih besar dari 3:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#find absolute value of z-score for each value in each column<\/span>\nz_scores &lt;- <span style=\"color: #3366ff;\">as.data.frame<\/span> (sapply(df, function(df) (abs(df-mean(df))\/sd(df))))\n\n<span style=\"color: #008080;\">#view first six rows of z_scores data frame\n<\/span>head(z_scores)\n\n          ABC\n1 1.2813403 0.25350805 0.39419878\n2 0.3110243 1.80496734 0.05890232\n3 1.3483190 0.12766847 0.08112630\n4 1.2908343 1.32044506 0.38824414\n5 0.4313316 1.40102642 0.44450451\n6 1.5271674 0.04327186 0.70295309\n\n<span style=\"color: #008080;\">#only keep rows in dataframe with all z-scores less than absolute value of 3<\/span> \nno_outliers &lt;- z_scores[!rowSums(z_scores&gt;3), ]\n\n<span style=\"color: #008080;\">#view row and column count of new data frame<\/span>\ndim(no_outliers)\n\n[1] 994 3\n<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Bingkai data asli memiliki 1000 baris dan 3 kolom. Bingkai data baru memiliki 994 baris dan 3 kolom, yang menunjukkan bahwa 6 baris telah dihapus karena memiliki setidaknya satu skor-z dengan nilai absolut lebih besar dari 3 di salah satu kolomnya.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Metode rentang antarkuartil:<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Dalam beberapa kasus, kami mungkin hanya ingin mengidentifikasi outlier di kolom bingkai data. Misalnya, kita hanya ingin menghapus baris dengan outlier di kolom &#8220;A&#8221; pada bingkai data kita.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Kode berikut menunjukkan cara menghilangkan baris dari bingkai data yang nilainya pada kolom &#8220;A&#8221; adalah 1,5 kali rentang interkuartil di atas kuartil ketiga (Q3) atau 1,5 kali rentang interkuartil di bawah kuartil pertama (Q1). .<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#find Q1, Q3, and interquartile range for values in column A<\/span>\nQ1 &lt;- quantile(df$A, .25)\nQ3 &lt;- quantile(df$A, .75)\nIQR &lt;- IQR(df$A)\n\n<span style=\"color: #008080;\">#only keep rows in dataframe that have values within 1.5*IQR of Q1 and Q3<\/span>\nno_outliers &lt;- subset(df, df$A&gt; (Q1 - 1.5*IQR) &amp; df$A&lt; (Q3 + 1.5*IQR))\n\n<span style=\"color: #008080;\">#view row and column count of new data frame\n<\/span>dim(no_outliers) \n\n[1] 994 3<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Bingkai data asli memiliki 1000 baris dan 3 kolom. Bingkai data baru memiliki 994 baris dan 3 kolom, yang menunjukkan bahwa 6 baris telah dihapus karena mengandung setidaknya satu outlier di kolom A.<\/span><\/p>\n<h3> <strong>Kapan harus menghilangkan outlier<\/strong><\/h3>\n<p> <span style=\"color: #000000;\">Jika ada satu atau lebih outlier, pertama-tama Anda harus memverifikasi bahwa outlier tersebut bukan akibat kesalahan entri data. Terkadang seseorang memasukkan nilai data yang salah saat menyimpan data.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Jika outlier ternyata disebabkan oleh kesalahan entri data, Anda dapat memutuskan untuk memberinya nilai baru seperti <a href=\"https:\/\/statorials.org\/id\/mengukur-tendensi-sentral\/\" target=\"_blank\" rel=\"noopener noreferrer\">mean atau median<\/a> kumpulan data.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Jika nilainya benar-benar outlier, Anda dapat memilih untuk menghapusnya jika nilai tersebut akan berdampak signifikan pada analisis Anda secara keseluruhan. Pastikan untuk menyebutkan dalam laporan akhir atau analisis Anda bahwa Anda telah menghapus outlier.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Sumber daya tambahan<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Dalam tutorial ini, kami menggunakan <strong>rnorm()<\/strong> untuk menghasilkan vektor variabel acak yang terdistribusi normal dengan panjang vektor <em>n<\/em> , rata-rata populasi <em>\u03bc<\/em> , dan deviasi standar populasi <em>\u03c3<\/em> . Anda dapat mempelajari lebih lanjut tentang fitur ini <a href=\"https:\/\/statorials.org\/id\/dnorm-pnorm-rnorm-qnorm-di-r\/\" target=\"_blank\" rel=\"noopener noreferrer\">di sini<\/a> .<\/span><\/p>\n<p> <span style=\"color: #000000;\">Kami juga menggunakan <strong>sapply()<\/strong> untuk menerapkan fungsi ke setiap kolom dalam bingkai data yang menghitung skor-z. Anda dapat mempelajari lebih lanjut tentang fitur ini <a href=\"https:\/\/statorials.org\/id\/panduan-untuk-menerapkan-lapply-sapply-dan-tapply-di-r\/\" target=\"_blank\" rel=\"noopener noreferrer\">di sini<\/a> .<\/span><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Outlier adalah observasi yang jaraknya sangat jauh dari nilai lain dalam kumpulan data. Pencilan dapat menjadi masalah karena dapat mempengaruhi hasil analisis. Tutorial ini menjelaskan cara mengidentifikasi dan menghapus outlier di R. Bagaimana mengidentifikasi outlier di R Sebelum Anda dapat menghapus outlier, Anda harus terlebih dahulu memutuskan apa yang Anda anggap sebagai outlier. Ada dua [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Cara menghapus outlier di R - Statorials<\/title>\n<meta name=\"description\" content=\"Penjelasan sederhana cara menghilangkan outlier di R, disertai beberapa contoh.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/id\/menghapus-outlier-r\/\" \/>\n<meta property=\"og:locale\" content=\"id_ID\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Cara menghapus outlier di R - Statorials\" \/>\n<meta property=\"og:description\" content=\"Penjelasan sederhana cara menghilangkan outlier di R, disertai beberapa contoh.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/id\/menghapus-outlier-r\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-28T08:02:55+00:00\" \/>\n<meta name=\"author\" content=\"Benjamin anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Ditulis oleh\" \/>\n\t<meta name=\"twitter:data1\" content=\"Benjamin anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Estimasi waktu membaca\" \/>\n\t<meta name=\"twitter:data2\" content=\"4 menit\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/id\/menghapus-outlier-r\/\",\"url\":\"https:\/\/statorials.org\/id\/menghapus-outlier-r\/\",\"name\":\"Cara menghapus outlier di R - Statorials\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/id\/#website\"},\"datePublished\":\"2023-07-28T08:02:55+00:00\",\"dateModified\":\"2023-07-28T08:02:55+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/id\/#\/schema\/person\/3d17a1160dd2d052b7c78e502cb9ec81\"},\"description\":\"Penjelasan sederhana cara menghilangkan outlier di R, disertai beberapa contoh.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/id\/menghapus-outlier-r\/#breadcrumb\"},\"inLanguage\":\"id\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/id\/menghapus-outlier-r\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/id\/menghapus-outlier-r\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\/\/statorials.org\/id\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Cara menghilangkan outlier di r\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/id\/#website\",\"url\":\"https:\/\/statorials.org\/id\/\",\"name\":\"Statorials\",\"description\":\"Panduan anda untuk kompetensi statistik!\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/id\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"id\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/id\/#\/schema\/person\/3d17a1160dd2d052b7c78e502cb9ec81\",\"name\":\"Benjamin anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"id\",\"@id\":\"https:\/\/statorials.org\/id\/#\/schema\/person\/image\/\",\"url\":\"http:\/\/statorials.org\/id\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"http:\/\/statorials.org\/id\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"caption\":\"Benjamin anderson\"},\"description\":\"Halo, saya Benjamin, pensiunan profesor statistika yang menjadi guru Statorial yang berdedikasi. Dengan pengalaman dan keahlian yang luas di bidang statistika, saya ingin berbagi ilmu untuk memberdayakan mahasiswa melalui Statorials. Baca selengkapnya\",\"sameAs\":[\"http:\/\/statorials.org\/id\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Cara menghapus outlier di R - Statorials","description":"Penjelasan sederhana cara menghilangkan outlier di R, disertai beberapa contoh.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/id\/menghapus-outlier-r\/","og_locale":"id_ID","og_type":"article","og_title":"Cara menghapus outlier di R - Statorials","og_description":"Penjelasan sederhana cara menghilangkan outlier di R, disertai beberapa contoh.","og_url":"https:\/\/statorials.org\/id\/menghapus-outlier-r\/","og_site_name":"Statorials","article_published_time":"2023-07-28T08:02:55+00:00","author":"Benjamin anderson","twitter_card":"summary_large_image","twitter_misc":{"Ditulis oleh":"Benjamin anderson","Estimasi waktu membaca":"4 menit"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/id\/menghapus-outlier-r\/","url":"https:\/\/statorials.org\/id\/menghapus-outlier-r\/","name":"Cara menghapus outlier di R - Statorials","isPartOf":{"@id":"https:\/\/statorials.org\/id\/#website"},"datePublished":"2023-07-28T08:02:55+00:00","dateModified":"2023-07-28T08:02:55+00:00","author":{"@id":"https:\/\/statorials.org\/id\/#\/schema\/person\/3d17a1160dd2d052b7c78e502cb9ec81"},"description":"Penjelasan sederhana cara menghilangkan outlier di R, disertai beberapa contoh.","breadcrumb":{"@id":"https:\/\/statorials.org\/id\/menghapus-outlier-r\/#breadcrumb"},"inLanguage":"id","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/id\/menghapus-outlier-r\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/id\/menghapus-outlier-r\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/statorials.org\/id\/"},{"@type":"ListItem","position":2,"name":"Cara menghilangkan outlier di r"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/id\/#website","url":"https:\/\/statorials.org\/id\/","name":"Statorials","description":"Panduan anda untuk kompetensi statistik!","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/id\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"id"},{"@type":"Person","@id":"https:\/\/statorials.org\/id\/#\/schema\/person\/3d17a1160dd2d052b7c78e502cb9ec81","name":"Benjamin anderson","image":{"@type":"ImageObject","inLanguage":"id","@id":"https:\/\/statorials.org\/id\/#\/schema\/person\/image\/","url":"http:\/\/statorials.org\/id\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","contentUrl":"http:\/\/statorials.org\/id\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","caption":"Benjamin anderson"},"description":"Halo, saya Benjamin, pensiunan profesor statistika yang menjadi guru Statorial yang berdedikasi. Dengan pengalaman dan keahlian yang luas di bidang statistika, saya ingin berbagi ilmu untuk memberdayakan mahasiswa melalui Statorials. Baca selengkapnya","sameAs":["http:\/\/statorials.org\/id"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/posts\/917"}],"collection":[{"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/comments?post=917"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/posts\/917\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/media?parent=917"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/categories?post=917"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/tags?post=917"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}