{"id":1222,"date":"2023-07-27T06:00:40","date_gmt":"2023-07-27T06:00:40","guid":{"rendered":"https:\/\/statorials.org\/id\/pembelajaran-mesin-mengantongi\/"},"modified":"2023-07-27T06:00:40","modified_gmt":"2023-07-27T06:00:40","slug":"pembelajaran-mesin-mengantongi","status":"publish","type":"post","link":"https:\/\/statorials.org\/id\/pembelajaran-mesin-mengantongi\/","title":{"rendered":"Pengantar mengantongi dalam pembelajaran mesin"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\">Jika hubungan antara sekumpulan variabel prediktor dan <a href=\"https:\/\/statorials.org\/id\/variabel-tanggapan-penjelas\/\" target=\"_blank\" rel=\"noopener noreferrer\">variabel respons<\/a> bersifat linier, kita dapat menggunakan metode seperti <a href=\"https:\/\/statorials.org\/id\/regresi-linier-berganda\/\" target=\"_blank\" rel=\"noopener noreferrer\">regresi linier berganda<\/a> untuk memodelkan hubungan antar variabel.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Namun, ketika hubungan menjadi lebih kompleks, kita sering kali harus menggunakan metode non-linier.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Salah satu metode tersebut adalah <a href=\"https:\/\/statorials.org\/id\/pohon-klasifikasi-dan-regresi\/\" target=\"_blank\" rel=\"noopener noreferrer\">pohon klasifikasi dan regresi<\/a> (sering disingkat CART), yang menggunakan sekumpulan variabel prediktor untuk membuat <em>pohon keputusan<\/em> yang memprediksi nilai variabel respons.<\/span> <\/p>\n<figure id=\"attachment_12094\" aria-describedby=\"caption-attachment-12094\" style=\"width: 453px\" class=\"wp-caption aligncenter\"><img decoding=\"async\" loading=\"lazy\" class=\"wp-image-12094\" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/arbre3.png\" alt=\"\" width=\"453\" height=\"347\" srcset=\"\" sizes=\"\"><figcaption id=\"caption-attachment-12094\" class=\"wp-caption-text\"> <strong><span style=\"color: #000000;\">Contoh pohon regresi yang menggunakan pengalaman bertahun-tahun dan rata-rata home run untuk memprediksi gaji pemain bisbol profesional.<\/span><\/strong><\/figcaption><\/figure>\n<p> <span style=\"color: #000000;\">Namun, kelemahan model CART adalah model tersebut cenderung memiliki <a href=\"https:\/\/statorials.org\/id\/kompromi-varians-bias\/\" target=\"_blank\" rel=\"noopener noreferrer\">varian yang tinggi<\/a> . Artinya, jika kita membagi kumpulan data menjadi dua bagian dan menerapkan pohon keputusan pada kedua bagian tersebut, hasilnya bisa sangat berbeda.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Salah satu metode yang dapat kita gunakan untuk mengurangi varian model CART dikenal sebagai <strong>bagging<\/strong> , terkadang disebut <em>agregasi bootstrap<\/em> .<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Apa itu mengantongi?<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Saat kami membuat pohon keputusan tunggal, kami hanya menggunakan satu set data pelatihan untuk membangun model.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Namun, <strong>mengantongi<\/strong> menggunakan metode berikut:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>1.<\/strong> Ambil <em>b<\/em> sampel bootstrap dari kumpulan data asli.<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Ingatlah bahwa <em>sampel bootstrap<\/em> adalah sampel dari kumpulan data asli di mana observasi diambil dengan penggantian.<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\"><strong>2.<\/strong> Buat pohon keputusan untuk setiap sampel bootstrap.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>3.<\/strong> Rata-ratakan prediksi dari setiap pohon untuk mendapatkan model akhir.<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Untuk pohon regresi, kami mengambil rata-rata prediksi yang dibuat oleh pohon <em>B.<\/em><\/span><\/li>\n<li> <span style=\"color: #000000;\">Untuk pohon klasifikasi, kami mengambil prediksi paling umum yang dibuat oleh pohon- <em>B<\/em> .<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Bagging dapat digunakan dengan algoritma pembelajaran mesin apa pun, namun ini sangat berguna untuk pohon keputusan karena mereka secara inheren memiliki varians yang tinggi dan bagging mampu mengurangi varians secara signifikan, sehingga mengurangi kesalahan pengujian.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Untuk menerapkan bagging pada pohon keputusan, kami <em>menanam<\/em> satu pohon secara mendalam tanpa memangkasnya. Hal ini menghasilkan pohon individu dengan varian tinggi, namun bias rendah. Kemudian ketika kita mengambil prediksi rata-rata dari pohon-pohon tersebut, kita dapat mengurangi variansnya.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Dalam praktiknya, kinerja optimal biasanya dicapai dengan 50 hingga 500 pohon, namun ribuan pohon dapat disesuaikan untuk menghasilkan model akhir.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Ingatlah bahwa memasang lebih banyak pohon akan memerlukan lebih banyak daya komputasi, yang mungkin menjadi masalah atau tidak tergantung pada ukuran kumpulan data.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Estimasi kesalahan di luar kantong<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Ternyata kita dapat menghitung kesalahan pengujian model yang dikantongi tanpa bergantung pada <a href=\"https:\/\/statorials.org\/id\/k-lipat-validasi-silang\/\" target=\"_blank\" rel=\"noopener noreferrer\">validasi silang k-fold<\/a> .<\/span><\/p>\n<p> <span style=\"color: #000000;\">Alasannya adalah bahwa setiap sampel bootstrap terbukti berisi sekitar 2\/3 observasi dari kumpulan data asli. Sepertiga sisa observasi yang tidak digunakan untuk menyesuaikan pohon yang dikantongi disebut <strong>observasi di luar kantong (OOB)<\/strong> .<\/span><\/p>\n<p> <span style=\"color: #000000;\">Nilai observasi ke-i pada dataset asli dapat kita prediksi dengan mengambil rata-rata prediksi dari masing-masing pohon yang observasinya adalah OOB.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Kita dapat menggunakan pendekatan ini untuk membuat prediksi untuk semua <em>n<\/em> pengamatan dalam kumpulan data asli dan kemudian menghitung tingkat kesalahan, yang merupakan perkiraan kesalahan pengujian yang valid.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Keuntungan menggunakan pendekatan ini untuk memperkirakan kesalahan pengujian adalah bahwa pendekatan ini jauh lebih cepat dibandingkan validasi silang k-fold, terutama bila kumpulan datanya besar.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Memahami pentingnya prediktor<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Ingatlah bahwa salah satu kelebihan pohon keputusan adalah mudah diinterpretasikan dan divisualisasikan.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Jika kita menggunakan bagging, kita tidak lagi dapat menginterpretasikan atau memvisualisasikan satu pohon karena model akhir yang dikantongi adalah hasil rata-rata dari banyak pohon yang berbeda. Kami memperoleh akurasi prediksi dengan mengorbankan kemampuan interpretasi.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Namun, kita masih dapat memahami pentingnya setiap variabel prediktor dengan menghitung total pengurangan RSS (jumlah sisa kuadrat) karena distribusi pada prediktor tertentu, yang dirata-ratakan pada semua <em>B-<\/em> tree. Semakin besar nilainya, semakin penting prediktornya.<\/span> <\/p>\n<figure id=\"attachment_12115\" aria-describedby=\"caption-attachment-12115\" style=\"width: 411px\" class=\"wp-caption aligncenter\"><img decoding=\"async\" loading=\"lazy\" class=\"wp-image-12115\" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/sac1.png\" alt=\"Bagan kepentingan variabel untuk model pengantongan\" width=\"411\" height=\"380\" srcset=\"\" sizes=\"\"><figcaption id=\"caption-attachment-12115\" class=\"wp-caption-text\"> <span style=\"color: #000000;\"><strong>Contoh bagan kepentingan variabel.<\/strong><\/span><\/figcaption><\/figure>\n<p> <span style=\"color: #000000;\">Demikian pula, untuk model klasifikasi, kita dapat menghitung total pengurangan indeks Gini karena distribusi pada prediktor tertentu, yang dirata-ratakan pada semua pohon <em>B.<\/em> Semakin besar nilainya, semakin penting prediktornya.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Jadi, meskipun kami tidak dapat secara tepat menginterpretasikan model akhir secara keseluruhan, kami masih dapat memperoleh gambaran tentang seberapa penting setiap variabel prediktor saat memprediksi respons.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Lebih dari sekadar mengantongi<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Keuntungan dari bagging adalah secara umum memberikan peningkatan tingkat kesalahan pengujian dibandingkan dengan pohon keputusan tunggal.<\/span><\/p>\n<p data-slot-rendered-dynamic=\"true\"> <span style=\"color: #000000;\">Kelemahannya adalah prediksi dari pengumpulan baggged tree bisa sangat berkorelasi jika terdapat prediktor yang sangat kuat dalam kumpulan data.<\/span><\/p>\n<p data-slot-rendered-dynamic=\"true\"> <span style=\"color: #000000;\">Dalam hal ini, sebagian besar atau seluruh pohon yang dikantongi akan menggunakan prediktor ini untuk pembelahan pertama, sehingga menghasilkan pohon-pohon yang mirip satu sama lain dan memiliki prediksi yang sangat berkorelasi.<\/span><\/p>\n<p data-slot-rendered-dynamic=\"true\"> <span style=\"color: #000000;\">Salah satu cara mengatasi masalah ini adalah dengan menggunakan hutan acak, yang menggunakan metode yang mirip dengan pembuatan kantong tetapi mampu menghasilkan pohon hias, yang sering kali menghasilkan tingkat kesalahan pengujian yang lebih rendah.<\/span><\/p>\n<p data-slot-rendered-dynamic=\"true\"> <span style=\"color: #000000;\">Anda dapat membaca pengenalan sederhana tentang hutan acak di sini .<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Sumber daya tambahan<\/strong><\/span><\/h3>\n<p> <a href=\"https:\/\/statorials.org\/id\/pohon-klasifikasi-dan-regresi\/\" target=\"_blank\" rel=\"noopener noreferrer\">Pengantar pohon klasifikasi dan regresi<\/a><br \/> <a href=\"https:\/\/statorials.org\/id\/mengantongi-di-r\/\" target=\"_blank\" rel=\"noopener noreferrer\">Cara Melakukan Bagging di R (Langkah demi Langkah)<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Jika hubungan antara sekumpulan variabel prediktor dan variabel respons bersifat linier, kita dapat menggunakan metode seperti regresi linier berganda untuk memodelkan hubungan antar variabel. Namun, ketika hubungan menjadi lebih kompleks, kita sering kali harus menggunakan metode non-linier. Salah satu metode tersebut adalah pohon klasifikasi dan regresi (sering disingkat CART), yang menggunakan sekumpulan variabel prediktor untuk [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Pengantar Bagging dalam Machine Learning - Statorial<\/title>\n<meta name=\"description\" content=\"Tutorial ini memberikan pengenalan singkat tentang bagging, metode yang umum digunakan dalam pembelajaran mesin.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/id\/pembelajaran-mesin-mengantongi\/\" \/>\n<meta property=\"og:locale\" content=\"id_ID\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Pengantar Bagging dalam Machine Learning - Statorial\" \/>\n<meta property=\"og:description\" content=\"Tutorial ini memberikan pengenalan singkat tentang bagging, metode yang umum digunakan dalam pembelajaran mesin.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/id\/pembelajaran-mesin-mengantongi\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-27T06:00:40+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/arbre3.png\" \/>\n<meta name=\"author\" content=\"Benjamin anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Ditulis oleh\" \/>\n\t<meta name=\"twitter:data1\" content=\"Benjamin anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Estimasi waktu membaca\" \/>\n\t<meta name=\"twitter:data2\" content=\"4 menit\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/id\/pembelajaran-mesin-mengantongi\/\",\"url\":\"https:\/\/statorials.org\/id\/pembelajaran-mesin-mengantongi\/\",\"name\":\"Pengantar Bagging dalam Machine Learning - Statorial\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/id\/#website\"},\"datePublished\":\"2023-07-27T06:00:40+00:00\",\"dateModified\":\"2023-07-27T06:00:40+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/id\/#\/schema\/person\/3d17a1160dd2d052b7c78e502cb9ec81\"},\"description\":\"Tutorial ini memberikan pengenalan singkat tentang bagging, metode yang umum digunakan dalam pembelajaran mesin.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/id\/pembelajaran-mesin-mengantongi\/#breadcrumb\"},\"inLanguage\":\"id\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/id\/pembelajaran-mesin-mengantongi\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/id\/pembelajaran-mesin-mengantongi\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\/\/statorials.org\/id\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Pengantar mengantongi dalam pembelajaran mesin\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/id\/#website\",\"url\":\"https:\/\/statorials.org\/id\/\",\"name\":\"Statorials\",\"description\":\"Panduan anda untuk kompetensi statistik!\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/id\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"id\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/id\/#\/schema\/person\/3d17a1160dd2d052b7c78e502cb9ec81\",\"name\":\"Benjamin anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"id\",\"@id\":\"https:\/\/statorials.org\/id\/#\/schema\/person\/image\/\",\"url\":\"http:\/\/statorials.org\/id\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"http:\/\/statorials.org\/id\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"caption\":\"Benjamin anderson\"},\"description\":\"Halo, saya Benjamin, pensiunan profesor statistika yang menjadi guru Statorial yang berdedikasi. Dengan pengalaman dan keahlian yang luas di bidang statistika, saya ingin berbagi ilmu untuk memberdayakan mahasiswa melalui Statorials. Baca selengkapnya\",\"sameAs\":[\"http:\/\/statorials.org\/id\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Pengantar Bagging dalam Machine Learning - Statorial","description":"Tutorial ini memberikan pengenalan singkat tentang bagging, metode yang umum digunakan dalam pembelajaran mesin.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/id\/pembelajaran-mesin-mengantongi\/","og_locale":"id_ID","og_type":"article","og_title":"Pengantar Bagging dalam Machine Learning - Statorial","og_description":"Tutorial ini memberikan pengenalan singkat tentang bagging, metode yang umum digunakan dalam pembelajaran mesin.","og_url":"https:\/\/statorials.org\/id\/pembelajaran-mesin-mengantongi\/","og_site_name":"Statorials","article_published_time":"2023-07-27T06:00:40+00:00","og_image":[{"url":"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/arbre3.png"}],"author":"Benjamin anderson","twitter_card":"summary_large_image","twitter_misc":{"Ditulis oleh":"Benjamin anderson","Estimasi waktu membaca":"4 menit"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/id\/pembelajaran-mesin-mengantongi\/","url":"https:\/\/statorials.org\/id\/pembelajaran-mesin-mengantongi\/","name":"Pengantar Bagging dalam Machine Learning - Statorial","isPartOf":{"@id":"https:\/\/statorials.org\/id\/#website"},"datePublished":"2023-07-27T06:00:40+00:00","dateModified":"2023-07-27T06:00:40+00:00","author":{"@id":"https:\/\/statorials.org\/id\/#\/schema\/person\/3d17a1160dd2d052b7c78e502cb9ec81"},"description":"Tutorial ini memberikan pengenalan singkat tentang bagging, metode yang umum digunakan dalam pembelajaran mesin.","breadcrumb":{"@id":"https:\/\/statorials.org\/id\/pembelajaran-mesin-mengantongi\/#breadcrumb"},"inLanguage":"id","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/id\/pembelajaran-mesin-mengantongi\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/id\/pembelajaran-mesin-mengantongi\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/statorials.org\/id\/"},{"@type":"ListItem","position":2,"name":"Pengantar mengantongi dalam pembelajaran mesin"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/id\/#website","url":"https:\/\/statorials.org\/id\/","name":"Statorials","description":"Panduan anda untuk kompetensi statistik!","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/id\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"id"},{"@type":"Person","@id":"https:\/\/statorials.org\/id\/#\/schema\/person\/3d17a1160dd2d052b7c78e502cb9ec81","name":"Benjamin anderson","image":{"@type":"ImageObject","inLanguage":"id","@id":"https:\/\/statorials.org\/id\/#\/schema\/person\/image\/","url":"http:\/\/statorials.org\/id\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","contentUrl":"http:\/\/statorials.org\/id\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","caption":"Benjamin anderson"},"description":"Halo, saya Benjamin, pensiunan profesor statistika yang menjadi guru Statorial yang berdedikasi. Dengan pengalaman dan keahlian yang luas di bidang statistika, saya ingin berbagi ilmu untuk memberdayakan mahasiswa melalui Statorials. Baca selengkapnya","sameAs":["http:\/\/statorials.org\/id"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/posts\/1222"}],"collection":[{"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/comments?post=1222"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/posts\/1222\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/media?parent=1222"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/categories?post=1222"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/tags?post=1222"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}