{"id":1182,"date":"2023-07-27T09:25:17","date_gmt":"2023-07-27T09:25:17","guid":{"rendered":"https:\/\/statorials.org\/id\/pilihan-subset-terbaik\/"},"modified":"2023-07-27T09:25:17","modified_gmt":"2023-07-27T09:25:17","slug":"pilihan-subset-terbaik","status":"publish","type":"post","link":"https:\/\/statorials.org\/id\/pilihan-subset-terbaik\/","title":{"rendered":"Pilihan subset terbaik dalam pembelajaran mesin (penjelasan dan contoh)"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\">Dalam pembelajaran mesin, kita sering kali ingin membuat model menggunakan sekumpulan variabel prediktor dan <a href=\"https:\/\/statorials.org\/id\/variabel-tanggapan-penjelas\/\" target=\"_blank\" rel=\"noopener noreferrer\">variabel respons<\/a> . Tujuan kami adalah membangun model yang dapat secara efektif menggunakan variabel prediktor untuk memprediksi nilai variabel respon.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Mengingat sekumpulan <em>p<\/em> variabel prediktor total, ada banyak model yang berpotensi kita buat.<\/span> <span style=\"color: #000000;\">Salah satu metode yang dapat kita gunakan untuk memilih model <em>terbaik<\/em> dikenal sebagai <strong>pemilihan subset terbaik<\/strong> dan cara kerjanya sebagai berikut:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>1.<\/strong> Misalkan M <sub>0<\/sub> adalah model nol yang tidak mengandung variabel prediktif.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>2.<\/strong> Untuk k = 1, 2, \u2026p:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Cocok untuk semua model <sub>p<\/sub> C <sub>k<\/sub> yang berisi <em>k<\/em> prediktor persis.<\/span><\/li>\n<li> <span style=\"color: #000000;\">Pilih <sub>yang<\/sub> terbaik di antara model <sub>pCk<\/sub> ini dan beri nama <sub>Mk<\/sub> . Definisikan \u201cterbaik\u201d sebagai model dengan R <sup>2<\/sup> tertinggi atau, setara dengan RSS terendah.<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\"><strong>3.<\/strong> Pilih satu model terbaik dari M <sub>0<\/sub> \u2026 M <sub>p<\/sub> menggunakan kesalahan prediksi validasi silang, Cp, BIC, AIC atau R <sup>2<\/sup> yang disesuaikan.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Perhatikan bahwa untuk sekumpulan variabel prediktor <em>p<\/em> , terdapat 2 <sup>p<\/sup> model yang mungkin.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Contoh pemilihan subset terbaik<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Misalkan kita memiliki kumpulan data dengan p = 3 variabel prediktor dan variabel respon, y. Untuk melakukan pemilihan subkumpulan terbaik dengan kumpulan data ini, kami akan menyesuaikan model 2 <sup>p<\/sup> = 2 <sup>3<\/sup> = 8 berikut:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Sebuah model tanpa prediktor<\/span><\/li>\n<li> <span style=\"color: #000000;\">Model dengan prediktor x <sub>1<\/sub><\/span><\/li>\n<li> <span style=\"color: #000000;\">Model dengan prediktor x <sub>2<\/sub><\/span><\/li>\n<li> <span style=\"color: #000000;\">Model dengan prediktor x <sub>3<\/sub><\/span><\/li>\n<li> <span style=\"color: #000000;\">Model dengan prediktor x <sub>1<\/sub> , x <sub>2<\/sub><\/span><\/li>\n<li> <span style=\"color: #000000;\">Model dengan prediktor x <sub>1<\/sub> , x <sub>3<\/sub><\/span><\/li>\n<li> <span style=\"color: #000000;\">Model dengan prediktor x <sub>2<\/sub> , x <sub>3<\/sub><\/span><\/li>\n<li> <span style=\"color: #000000;\">Model dengan prediktor x <sub>1<\/sub> , x <sub>2<\/sub> , x <sub>3<\/sub><\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Kemudian kita akan memilih model dengan <sup>R2<\/sup> tertinggi dari setiap rangkaian model dengan <em>k<\/em> prediktor. Misalnya, kita mungkin memilih:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Sebuah model tanpa prediktor<\/span><\/li>\n<li> <span style=\"color: #000000;\">Model dengan prediktor x <sub>2<\/sub><\/span><\/li>\n<li> <span style=\"color: #000000;\">Model dengan prediktor x <sub>1<\/sub> , x <sub>2<\/sub><\/span><\/li>\n<li> <span style=\"color: #000000;\">Model dengan prediktor x <sub>1<\/sub> , x <sub>2<\/sub> , x <sub>3<\/sub><\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Kemudian kami akan <a href=\"https:\/\/statorials.org\/id\/k-lipat-validasi-silang\/\" target=\"_blank\" rel=\"noopener noreferrer\">melakukan validasi silang<\/a> dan memilih model terbaik yang menghasilkan kesalahan prediksi terendah, Cp, BIC, AIC, atau <sup>R2<\/sup> yang disesuaikan.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Misalnya, kita mungkin memilih model berikut sebagai model &#8220;terbaik&#8221; karena model tersebut menghasilkan kesalahan prediksi tervalidasi silang yang paling rendah:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Model dengan prediktor x <sub>1<\/sub> , x <sub>2<\/sub><\/span><\/li>\n<\/ul>\n<h3> <span style=\"color: #000000;\"><strong>Kriteria untuk memilih model \u201cterbaik\u201d.<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Langkah terakhir dalam memilih subset terbaik adalah memilih model dengan kesalahan prediksi terendah, Cp terendah, BIC terendah, AIC terendah, atau <sup>R2<\/sup> disesuaikan terendah. lebih tinggi.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Berikut rumus yang digunakan untuk menghitung masing-masing metrik tersebut:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Cp:<\/strong> (RSS+2d\u03c3\u0302) \/ n<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>AIC:<\/strong> (RSS+2d\u03c3\u0302 <sup>2<\/sup> ) \/ (n\u03c3\u0302 <sup>2<\/sup> )<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>BIC:<\/strong> (RSS+log(n)d\u03c3\u0302 <sup>2<\/sup> ) \/ n<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>R <sup>2<\/sup> disesuaikan:<\/strong> 1 \u2013 ( (RSS \/ (nd-1)) \/ (TSS \/ (n-1)) )<\/span><\/p>\n<p> <span style=\"color: #000000;\">Emas:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\"><strong>d:<\/strong> Jumlah prediktor<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>n:<\/strong> Jumlah pengamatan<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>\u03c3\u0302:<\/strong> Estimasi varians kesalahan yang terkait dengan setiap ukuran respons dalam model regresi<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>RSS:<\/strong> Jumlah sisa kuadrat dari model regresi<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>TSS:<\/strong> Jumlah total kuadrat model regresi<\/span><\/li>\n<\/ul>\n<h3> <span style=\"color: #000000;\"><strong>Keuntungan dan Kerugian Seleksi Subset Terbaik<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Memilih subset terbaik memberikan <strong>manfaat berikut:<\/strong><\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Ini adalah pendekatan sederhana untuk dipahami dan ditafsirkan.<\/span><\/li>\n<li> <span style=\"color: #000000;\">Hal ini memungkinkan kami mengidentifikasi model terbaik karena kami mempertimbangkan semua kombinasi variabel prediktor.<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Namun metode ini mempunyai <strong>kelemahan sebagai berikut:<\/strong><\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Hal ini dapat menjadi komputasi yang intens. Untuk sekumpulan variabel prediktor <em>p<\/em> , terdapat 2 <sup>p<\/sup> model yang mungkin. Misalnya, dengan 10 variabel prediktor, terdapat 2 <sup>10<\/sup> = 1000 model yang mungkin untuk dipertimbangkan.<\/span><\/li>\n<li> <span style=\"color: #000000;\">Karena mempertimbangkan jumlah model yang sangat besar, hal ini berpotensi menemukan model yang berperforma baik pada data pelatihan, namun tidak pada data mendatang. Hal ini dapat menyebabkan<\/span> <a href=\"https:\/\/statorials.org\/id\/pembelajaran-mesin-yang-berlebihan\/\" target=\"_blank\" rel=\"noopener noreferrer\">overfitting<\/a> <span style=\"color: #000000;\">.<\/span><\/li>\n<\/ul>\n<h3> <strong><span style=\"color: #000000;\">Kesimpulan<\/span><\/strong><\/h3>\n<p> <span style=\"color: #000000;\">Meskipun memilih subset terbaik mudah untuk diterapkan dan dipahami, hal ini mungkin tidak praktis jika Anda bekerja dengan set data yang berisi prediktor dalam jumlah besar dan berpotensi menyebabkan overfitting.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Alternatif metode ini dikenal sebagai <a href=\"https:\/\/statorials.org\/id\/seleksi-secara-bertahap\/\" target=\"_blank\" rel=\"noopener noreferrer\">seleksi bertahap<\/a> , yang lebih efisien secara komputasi.<\/span><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Dalam pembelajaran mesin, kita sering kali ingin membuat model menggunakan sekumpulan variabel prediktor dan variabel respons . Tujuan kami adalah membangun model yang dapat secara efektif menggunakan variabel prediktor untuk memprediksi nilai variabel respon. Mengingat sekumpulan p variabel prediktor total, ada banyak model yang berpotensi kita buat. Salah satu metode yang dapat kita gunakan untuk [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Pilihan subset terbaik dalam pembelajaran mesin (penjelasan dan contoh)<\/title>\n<meta name=\"description\" content=\"Tutorial ini memberikan penjelasan tentang pemilihan subset terbaik di bidang pembelajaran mesin.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/id\/pilihan-subset-terbaik\/\" \/>\n<meta property=\"og:locale\" content=\"id_ID\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Pilihan subset terbaik dalam pembelajaran mesin (penjelasan dan contoh)\" \/>\n<meta property=\"og:description\" content=\"Tutorial ini memberikan penjelasan tentang pemilihan subset terbaik di bidang pembelajaran mesin.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/id\/pilihan-subset-terbaik\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-27T09:25:17+00:00\" \/>\n<meta name=\"author\" content=\"Benjamin anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Ditulis oleh\" \/>\n\t<meta name=\"twitter:data1\" content=\"Benjamin anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Estimasi waktu membaca\" \/>\n\t<meta name=\"twitter:data2\" content=\"3 menit\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/id\/pilihan-subset-terbaik\/\",\"url\":\"https:\/\/statorials.org\/id\/pilihan-subset-terbaik\/\",\"name\":\"Pilihan subset terbaik dalam pembelajaran mesin (penjelasan dan contoh)\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/id\/#website\"},\"datePublished\":\"2023-07-27T09:25:17+00:00\",\"dateModified\":\"2023-07-27T09:25:17+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/id\/#\/schema\/person\/3d17a1160dd2d052b7c78e502cb9ec81\"},\"description\":\"Tutorial ini memberikan penjelasan tentang pemilihan subset terbaik di bidang pembelajaran mesin.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/id\/pilihan-subset-terbaik\/#breadcrumb\"},\"inLanguage\":\"id\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/id\/pilihan-subset-terbaik\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/id\/pilihan-subset-terbaik\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\/\/statorials.org\/id\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Pilihan subset terbaik dalam pembelajaran mesin (penjelasan dan contoh)\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/id\/#website\",\"url\":\"https:\/\/statorials.org\/id\/\",\"name\":\"Statorials\",\"description\":\"Panduan anda untuk kompetensi statistik!\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/id\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"id\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/id\/#\/schema\/person\/3d17a1160dd2d052b7c78e502cb9ec81\",\"name\":\"Benjamin anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"id\",\"@id\":\"https:\/\/statorials.org\/id\/#\/schema\/person\/image\/\",\"url\":\"http:\/\/statorials.org\/id\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"http:\/\/statorials.org\/id\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"caption\":\"Benjamin anderson\"},\"description\":\"Halo, saya Benjamin, pensiunan profesor statistika yang menjadi guru Statorial yang berdedikasi. Dengan pengalaman dan keahlian yang luas di bidang statistika, saya ingin berbagi ilmu untuk memberdayakan mahasiswa melalui Statorials. Baca selengkapnya\",\"sameAs\":[\"http:\/\/statorials.org\/id\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Pilihan subset terbaik dalam pembelajaran mesin (penjelasan dan contoh)","description":"Tutorial ini memberikan penjelasan tentang pemilihan subset terbaik di bidang pembelajaran mesin.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/id\/pilihan-subset-terbaik\/","og_locale":"id_ID","og_type":"article","og_title":"Pilihan subset terbaik dalam pembelajaran mesin (penjelasan dan contoh)","og_description":"Tutorial ini memberikan penjelasan tentang pemilihan subset terbaik di bidang pembelajaran mesin.","og_url":"https:\/\/statorials.org\/id\/pilihan-subset-terbaik\/","og_site_name":"Statorials","article_published_time":"2023-07-27T09:25:17+00:00","author":"Benjamin anderson","twitter_card":"summary_large_image","twitter_misc":{"Ditulis oleh":"Benjamin anderson","Estimasi waktu membaca":"3 menit"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/id\/pilihan-subset-terbaik\/","url":"https:\/\/statorials.org\/id\/pilihan-subset-terbaik\/","name":"Pilihan subset terbaik dalam pembelajaran mesin (penjelasan dan contoh)","isPartOf":{"@id":"https:\/\/statorials.org\/id\/#website"},"datePublished":"2023-07-27T09:25:17+00:00","dateModified":"2023-07-27T09:25:17+00:00","author":{"@id":"https:\/\/statorials.org\/id\/#\/schema\/person\/3d17a1160dd2d052b7c78e502cb9ec81"},"description":"Tutorial ini memberikan penjelasan tentang pemilihan subset terbaik di bidang pembelajaran mesin.","breadcrumb":{"@id":"https:\/\/statorials.org\/id\/pilihan-subset-terbaik\/#breadcrumb"},"inLanguage":"id","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/id\/pilihan-subset-terbaik\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/id\/pilihan-subset-terbaik\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/statorials.org\/id\/"},{"@type":"ListItem","position":2,"name":"Pilihan subset terbaik dalam pembelajaran mesin (penjelasan dan contoh)"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/id\/#website","url":"https:\/\/statorials.org\/id\/","name":"Statorials","description":"Panduan anda untuk kompetensi statistik!","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/id\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"id"},{"@type":"Person","@id":"https:\/\/statorials.org\/id\/#\/schema\/person\/3d17a1160dd2d052b7c78e502cb9ec81","name":"Benjamin anderson","image":{"@type":"ImageObject","inLanguage":"id","@id":"https:\/\/statorials.org\/id\/#\/schema\/person\/image\/","url":"http:\/\/statorials.org\/id\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","contentUrl":"http:\/\/statorials.org\/id\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","caption":"Benjamin anderson"},"description":"Halo, saya Benjamin, pensiunan profesor statistika yang menjadi guru Statorial yang berdedikasi. Dengan pengalaman dan keahlian yang luas di bidang statistika, saya ingin berbagi ilmu untuk memberdayakan mahasiswa melalui Statorials. Baca selengkapnya","sameAs":["http:\/\/statorials.org\/id"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/posts\/1182"}],"collection":[{"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/comments?post=1182"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/posts\/1182\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/media?parent=1182"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/categories?post=1182"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/tags?post=1182"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}