{"id":1223,"date":"2023-07-27T05:56:29","date_gmt":"2023-07-27T05:56:29","guid":{"rendered":"https:\/\/statorials.org\/id\/mengantongi-di-r\/"},"modified":"2023-07-27T05:56:29","modified_gmt":"2023-07-27T05:56:29","slug":"mengantongi-di-r","status":"publish","type":"post","link":"https:\/\/statorials.org\/id\/mengantongi-di-r\/","title":{"rendered":"Cara melakukan bagging di r (langkah demi langkah)"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\">Saat kami membuat <a href=\"https:\/\/statorials.org\/id\/pohon-klasifikasi-dan-regresi\/\" target=\"_blank\" rel=\"noopener noreferrer\">pohon keputusan<\/a> untuk kumpulan data tertentu, kami hanya menggunakan satu kumpulan data pelatihan untuk membangun model.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Namun, kelemahan dari penggunaan pohon keputusan tunggal adalah bahwa pohon tersebut cenderung memiliki <a href=\"https:\/\/statorials.org\/id\/kompromi-varians-bias\/\" target=\"_blank\" rel=\"noopener noreferrer\">varians yang tinggi<\/a> . Artinya, jika kita membagi kumpulan data menjadi dua bagian dan menerapkan pohon keputusan pada kedua bagian tersebut, hasilnya bisa sangat berbeda.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Salah satu metode yang dapat kita gunakan untuk mengurangi varians dari satu pohon keputusan dikenal sebagai <a href=\"https:\/\/statorials.org\/id\/pembelajaran-mesin-mengantongi\/\" target=\"_blank\" rel=\"noopener noreferrer\">bagging<\/a> , terkadang disebut <em>agregasi bootstrap<\/em> .<\/span><\/p>\n<p data-slot-rendered-dynamic=\"true\"> <span style=\"color: #000000;\">Pengantongan berfungsi sebagai berikut:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>1.<\/strong> Ambil <em>b<\/em> sampel bootstrap dari kumpulan data asli.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>2.<\/strong> Buat pohon keputusan untuk setiap sampel bootstrap.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>3.<\/strong> Rata-ratakan prediksi dari setiap pohon untuk mendapatkan model akhir.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Dengan membangun ratusan atau bahkan ribuan pohon keputusan individual dan mengambil prediksi rata-rata dari semua pohon, kita sering kali mendapatkan model tas yang sesuai yang menghasilkan tingkat kesalahan pengujian yang jauh lebih rendah dibandingkan dengan pohon keputusan tunggal.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Tutorial ini memberikan contoh langkah demi langkah tentang cara membuat model yang dikantongi di R.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Langkah 1: Muat paket yang diperlukan<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Pertama, kami akan memuat paket yang diperlukan untuk contoh ini:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #993300;\">library<\/span> (dplyr) <span style=\"color: #008080;\">#for data wrangling<\/span>\n<span style=\"color: #993300;\">library<\/span> (e1071) <span style=\"color: #008080;\">#for calculating variable importance<\/span>\n<span style=\"color: #993300;\">library<\/span> (caret) <span style=\"color: #008080;\">#for general model fitting<\/span>\n<span style=\"color: #993300;\">library<\/span> (rpart) <span style=\"color: #008080;\">#for fitting decision trees<\/span>\n<span style=\"color: #993300;\">library<\/span> (ipred) <span style=\"color: #008080;\">#for fitting bagged decision trees\n<\/span><\/strong><\/pre>\n<h3> <span style=\"color: #000000;\"><strong>Langkah 2: Pasangkan model yang dikantongi<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Untuk contoh ini, kami akan menggunakan kumpulan data R bawaan yang disebut <strong>Kualitas Udara<\/strong> yang berisi pengukuran kualitas udara di Kota New York selama 153 hari.<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#view structure of air quality dataset<\/span>\nstr(airquality)\n\n'data.frame': 153 obs. of 6 variables:\n $ Ozone: int 41 36 12 18 NA 28 23 19 8 NA ...\n $Solar.R: int 190 118 149 313 NA NA 299 99 19 194 ...\n $ Wind: num 7.4 8 12.6 11.5 14.3 14.9 8.6 13.8 20.1 8.6 ...\n $ Temp: int 67 72 74 62 56 66 65 59 61 69 ...\n $Month: int 5 5 5 5 5 5 5 5 5 5 ...\n $Day: int 1 2 3 4 5 6 7 8 9 10 ...\n<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Kode berikut menunjukkan cara menyesuaikan model yang dikantongi di R menggunakan fungsi <strong>bagging()<\/strong> dari perpustakaan <strong>ipred<\/strong> .<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#make this example reproducible\n<\/span>set.seed(1)\n\n<span style=\"color: #008080;\">#fit the bagged model\n<\/span>bag &lt;- bagging(\n  formula = Ozone ~ .,\n  data = airquality,\n  nbagg = <span style=\"color: #008000;\">150<\/span> ,   \n  coob = <span style=\"color: #008000;\">TRUE<\/span> ,\n  control = rpart. <span style=\"color: #3366ff;\">control<\/span> (minsplit = <span style=\"color: #008000;\">2<\/span> , cp = <span style=\"color: #008000;\">0<\/span> )\n)\n\n<span style=\"color: #008080;\">#display fitted bagged model\n<\/span>bag\n\nBagging regression trees with 150 bootstrap replications \n\nCall: bagging.data.frame(formula = Ozone ~ ., data = airquality, nbagg = 150, \n    coob = TRUE, control = rpart.control(minsplit = 2, cp = 0))\n\nOut-of-bag estimate of root mean squared error: 17.4973<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Perhatikan bahwa kami memilih untuk menggunakan <strong>150<\/strong> sampel bootstrap untuk membangun model yang dikantongi dan kami menetapkan bahwa <strong>coob<\/strong> adalah <strong>TRUE<\/strong> untuk mendapatkan perkiraan kesalahan di luar kantong.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Kami juga menggunakan spesifikasi berikut dalam fungsi <strong>rpart.control()<\/strong> :<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\"><strong>minsplit = 2:<\/strong> Ini memberitahu model untuk hanya memerlukan 2 observasi dalam satu node untuk dipisahkan.<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>cp = 0<\/strong> . Ini adalah parameter kompleksitas. Dengan menyetelnya ke 0, kami tidak mengharuskan model untuk dapat meningkatkan kesesuaian keseluruhan dengan cara apa pun untuk melakukan pemisahan.<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Pada dasarnya, kedua argumen ini memungkinkan setiap pohon untuk tumbuh sangat dalam, sehingga menghasilkan pohon dengan varian tinggi namun bias rendah. Kemudian, saat kami menerapkan bagging, kami dapat mengurangi varian model akhir sekaligus menjaga bias tetap rendah.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Dari hasil model, kita dapat melihat estimasi RMSE out-of-bag adalah <strong>17.4973<\/strong> . Ini adalah perbedaan rata-rata antara nilai perkiraan ozon dan nilai sebenarnya yang diamati.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Langkah 3: Visualisasikan pentingnya prediktor<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Meskipun model yang dikantongi cenderung memberikan prediksi yang lebih akurat dibandingkan pohon keputusan individual, sulit untuk menafsirkan dan memvisualisasikan hasil dari model yang dikantongi yang sesuai.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Namun, kita dapat memvisualisasikan pentingnya variabel prediktor dengan menghitung total pengurangan RSS (jumlah sisa kuadrat) karena distribusi pada prediktor tertentu, yang dirata-ratakan pada semua pohon. Semakin besar nilainya, semakin penting prediktornya.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Kode berikut menunjukkan cara membuat plot kepentingan variabel untuk model tas pas, menggunakan fungsi <strong>varImp()<\/strong> dari pustaka <strong>sisipan<\/strong> :<\/span> <\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#calculate variable importance\n<\/span>VI &lt;- data.frame(var= <span style=\"color: #3366ff;\">names<\/span> (airquality[,-1]), imp= <span style=\"color: #3366ff;\">varImp<\/span> (bag))\n\n<span style=\"color: #008080;\">#sort variable importance descending\n<\/span>VI_plot &lt;- VI[ <span style=\"color: #3366ff;\">order<\/span> (VI$Overall, decreasing= <span style=\"color: #008000;\">TRUE<\/span> ),]\n\n<span style=\"color: #008080;\">#visualize variable importance with horizontal bar plot\n<\/span>barplot(VI_plot$Overall,\n        names.arg= <span style=\"color: #3366ff;\">rownames<\/span> (VI_plot),\n        horiz= <span style=\"color: #008000;\">TRUE<\/span> ,\n        col=' <span style=\"color: #008000;\">steelblue<\/span> ',\n        xlab=' <span style=\"color: #008000;\">Variable Importance<\/span> ')\n<\/strong><\/pre>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-12115 \" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/sac1.png\" alt=\"Grafik kepentingan variabel di R\" width=\"424\" height=\"392\" srcset=\"\" sizes=\"\"><\/p>\n<p> <span style=\"color: #000000;\">Kita dapat melihat bahwa <strong>Solar.R<\/strong> adalah variabel prediktor terpenting dalam model, sedangkan <strong>Bulan<\/strong> adalah variabel yang paling tidak penting.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Langkah 4: Gunakan model untuk membuat prediksi<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Terakhir, kita dapat menggunakan model tas pas untuk membuat prediksi tentang observasi baru.<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#define new observation\n<\/span>new &lt;- data.frame(Solar.R=150, Wind=8, Temp=70, Month=5, Day=5)\n\n<span style=\"color: #008080;\">#use fitted bagged model to predict Ozone value of new observation\n<\/span>predict(bag, newdata=new)\n\n24.4866666666667\n<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Berdasarkan nilai variabel prediktor, model tas pas memperkirakan nilai ozon pada hari tersebut adalah <strong>24.487<\/strong> .<\/span><\/p>\n<p> <span style=\"color: #000000;\">Kode R lengkap yang digunakan dalam contoh ini dapat ditemukan <a href=\"https:\/\/github.com\/Statorials\/R-Guides\/blob\/main\/bagging.R\" target=\"_blank\" rel=\"noopener noreferrer\">di sini<\/a> .<\/span><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Saat kami membuat pohon keputusan untuk kumpulan data tertentu, kami hanya menggunakan satu kumpulan data pelatihan untuk membangun model. Namun, kelemahan dari penggunaan pohon keputusan tunggal adalah bahwa pohon tersebut cenderung memiliki varians yang tinggi . Artinya, jika kita membagi kumpulan data menjadi dua bagian dan menerapkan pohon keputusan pada kedua bagian tersebut, hasilnya bisa [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Cara Mengantongi di R (Langkah demi Langkah) - Statologi<\/title>\n<meta name=\"description\" content=\"Tutorial ini menjelaskan cara mengantongi R, termasuk contoh langkah demi langkah.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/id\/mengantongi-di-r\/\" \/>\n<meta property=\"og:locale\" content=\"id_ID\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Cara Mengantongi di R (Langkah demi Langkah) - Statologi\" \/>\n<meta property=\"og:description\" content=\"Tutorial ini menjelaskan cara mengantongi R, termasuk contoh langkah demi langkah.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/id\/mengantongi-di-r\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-27T05:56:29+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/sac1.png\" \/>\n<meta name=\"author\" content=\"Benjamin anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Ditulis oleh\" \/>\n\t<meta name=\"twitter:data1\" content=\"Benjamin anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Estimasi waktu membaca\" \/>\n\t<meta name=\"twitter:data2\" content=\"4 menit\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/id\/mengantongi-di-r\/\",\"url\":\"https:\/\/statorials.org\/id\/mengantongi-di-r\/\",\"name\":\"Cara Mengantongi di R (Langkah demi Langkah) - Statologi\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/id\/#website\"},\"datePublished\":\"2023-07-27T05:56:29+00:00\",\"dateModified\":\"2023-07-27T05:56:29+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/id\/#\/schema\/person\/3d17a1160dd2d052b7c78e502cb9ec81\"},\"description\":\"Tutorial ini menjelaskan cara mengantongi R, termasuk contoh langkah demi langkah.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/id\/mengantongi-di-r\/#breadcrumb\"},\"inLanguage\":\"id\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/id\/mengantongi-di-r\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/id\/mengantongi-di-r\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\/\/statorials.org\/id\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Cara melakukan bagging di r (langkah demi langkah)\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/id\/#website\",\"url\":\"https:\/\/statorials.org\/id\/\",\"name\":\"Statorials\",\"description\":\"Panduan anda untuk kompetensi statistik!\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/id\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"id\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/id\/#\/schema\/person\/3d17a1160dd2d052b7c78e502cb9ec81\",\"name\":\"Benjamin anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"id\",\"@id\":\"https:\/\/statorials.org\/id\/#\/schema\/person\/image\/\",\"url\":\"http:\/\/statorials.org\/id\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"http:\/\/statorials.org\/id\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"caption\":\"Benjamin anderson\"},\"description\":\"Halo, saya Benjamin, pensiunan profesor statistika yang menjadi guru Statorial yang berdedikasi. Dengan pengalaman dan keahlian yang luas di bidang statistika, saya ingin berbagi ilmu untuk memberdayakan mahasiswa melalui Statorials. Baca selengkapnya\",\"sameAs\":[\"http:\/\/statorials.org\/id\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Cara Mengantongi di R (Langkah demi Langkah) - Statologi","description":"Tutorial ini menjelaskan cara mengantongi R, termasuk contoh langkah demi langkah.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/id\/mengantongi-di-r\/","og_locale":"id_ID","og_type":"article","og_title":"Cara Mengantongi di R (Langkah demi Langkah) - Statologi","og_description":"Tutorial ini menjelaskan cara mengantongi R, termasuk contoh langkah demi langkah.","og_url":"https:\/\/statorials.org\/id\/mengantongi-di-r\/","og_site_name":"Statorials","article_published_time":"2023-07-27T05:56:29+00:00","og_image":[{"url":"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/sac1.png"}],"author":"Benjamin anderson","twitter_card":"summary_large_image","twitter_misc":{"Ditulis oleh":"Benjamin anderson","Estimasi waktu membaca":"4 menit"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/id\/mengantongi-di-r\/","url":"https:\/\/statorials.org\/id\/mengantongi-di-r\/","name":"Cara Mengantongi di R (Langkah demi Langkah) - Statologi","isPartOf":{"@id":"https:\/\/statorials.org\/id\/#website"},"datePublished":"2023-07-27T05:56:29+00:00","dateModified":"2023-07-27T05:56:29+00:00","author":{"@id":"https:\/\/statorials.org\/id\/#\/schema\/person\/3d17a1160dd2d052b7c78e502cb9ec81"},"description":"Tutorial ini menjelaskan cara mengantongi R, termasuk contoh langkah demi langkah.","breadcrumb":{"@id":"https:\/\/statorials.org\/id\/mengantongi-di-r\/#breadcrumb"},"inLanguage":"id","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/id\/mengantongi-di-r\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/id\/mengantongi-di-r\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/statorials.org\/id\/"},{"@type":"ListItem","position":2,"name":"Cara melakukan bagging di r (langkah demi langkah)"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/id\/#website","url":"https:\/\/statorials.org\/id\/","name":"Statorials","description":"Panduan anda untuk kompetensi statistik!","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/id\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"id"},{"@type":"Person","@id":"https:\/\/statorials.org\/id\/#\/schema\/person\/3d17a1160dd2d052b7c78e502cb9ec81","name":"Benjamin anderson","image":{"@type":"ImageObject","inLanguage":"id","@id":"https:\/\/statorials.org\/id\/#\/schema\/person\/image\/","url":"http:\/\/statorials.org\/id\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","contentUrl":"http:\/\/statorials.org\/id\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","caption":"Benjamin anderson"},"description":"Halo, saya Benjamin, pensiunan profesor statistika yang menjadi guru Statorial yang berdedikasi. Dengan pengalaman dan keahlian yang luas di bidang statistika, saya ingin berbagi ilmu untuk memberdayakan mahasiswa melalui Statorials. Baca selengkapnya","sameAs":["http:\/\/statorials.org\/id"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/posts\/1223"}],"collection":[{"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/comments?post=1223"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/posts\/1223\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/media?parent=1223"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/categories?post=1223"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/tags?post=1223"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}