{"id":1177,"date":"2023-07-27T09:50:11","date_gmt":"2023-07-27T09:50:11","guid":{"rendered":"https:\/\/statorials.org\/id\/k-lipat-validasi-silang\/"},"modified":"2023-07-27T09:50:11","modified_gmt":"2023-07-27T09:50:11","slug":"k-lipat-validasi-silang","status":"publish","type":"post","link":"https:\/\/statorials.org\/id\/k-lipat-validasi-silang\/","title":{"rendered":"Panduan sederhana untuk validasi silang k-fold"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\">Untuk mengevaluasi performa suatu model pada kumpulan data, kita perlu mengukur seberapa cocok prediksi yang dibuat oleh model tersebut dengan data yang diamati.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Cara paling umum untuk mengukurnya adalah dengan menggunakan mean square error (MSE), yang dihitung sebagai berikut:<\/span><\/p>\n<p> <span style=\"color: #000000;\">MSE = (1\/n)*\u03a3(y <sub>saya<\/sub> \u2013 f(x <sub>saya<\/sub> )) <sup>2<\/sup><\/span><\/p>\n<p> <span style=\"color: #000000;\">Emas:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\"><strong>n:<\/strong> jumlah total observasi<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>y <sub>i<\/sub> :<\/strong> Nilai respon observasi <sup>ke-i<\/sup><\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>f(x <sub>i<\/sub> ) :<\/strong> Nilai respon prediksi observasi <sup>ke<\/sup> -i<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Semakin dekat prediksi model dengan observasi, maka MSE akan semakin rendah.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Dalam praktiknya, kami menggunakan proses berikut untuk menghitung MSE model tertentu:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>1.<\/strong> Bagilah kumpulan data menjadi kumpulan pelatihan dan kumpulan pengujian.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>2.<\/strong> Buat model hanya dengan menggunakan data dari set pelatihan.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>3.<\/strong> Gunakan model untuk membuat prediksi tentang rangkaian tes dan mengukur MSE tes tersebut.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Pengujian MSE memberi kita gambaran tentang seberapa baik kinerja model pada data yang belum pernah dilihat sebelumnya. Namun, kelemahan menggunakan satu set tes adalah tes MSE dapat bervariasi secara signifikan tergantung pada observasi yang digunakan dalam set pelatihan dan tes.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Salah satu cara untuk menghindari masalah ini adalah dengan menyesuaikan model beberapa kali menggunakan set pelatihan dan pengujian yang berbeda setiap kali, lalu menghitung UMK pengujian sebagai rata-rata dari semua UMK pengujian.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Metode umum ini dikenal sebagai validasi silang dan bentuk spesifiknya dikenal sebagai <b>validasi silang k-fold<\/b> .<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Validasi silang K-Fold<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\"><strong>Validasi silang K-fold<\/strong> menggunakan pendekatan berikut untuk mengevaluasi model:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Langkah 1: Bagi kumpulan data secara acak menjadi <em>k<\/em> kelompok, atau \u201clipatan\u201d, dengan ukuran yang kira-kira sama.<\/strong><\/span> <\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-11712 \" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/kfold1.png\" alt=\"Bagi kumpulan data menjadi k lipatan\" width=\"530\" height=\"133\" srcset=\"\" sizes=\"\"><\/p>\n<p> <span style=\"color: #000000;\"><strong>Langkah 2: Pilih salah satu lipatan sebagai set pegangan Anda. Sesuaikan template dengan sisa k-1 lipatan. Hitung uji MSE pada pengamatan pada lapisan yang dikencangkan.<\/strong><\/span> <\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-11713 \" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/kfold2.png\" alt=\"validasi silang k-fold\" width=\"550\" height=\"174\" srcset=\"\" sizes=\"\"><\/p>\n<p> <span style=\"color: #000000;\"><strong>Langkah 3: Ulangi proses ini sebanyak <em>k<\/em> kali, setiap kali menggunakan himpunan berbeda sebagai himpunan pengecualian.<\/strong><\/span> <\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-11714 \" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/kfold3.png\" alt=\"Contoh validasi silang k-fold\" width=\"618\" height=\"234\" srcset=\"\" sizes=\"\"><\/p>\n<p> <span style=\"color: #000000;\"><strong>Langkah 4: Hitung keseluruhan UMK tes sebagai rata-rata dari <em>k<\/em> UMK tes tersebut.<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Uji MSE = (1\/k)*\u03a3MSE <sub>i<\/sub><\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Emas:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\"><strong>k :<\/strong> Jumlah lipatan<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>MSE <sub>i<\/sub><\/strong> : Menguji MSE pada iterasi <sup>ke-i<\/sup><\/span><\/li>\n<\/ul>\n<h3> <span style=\"color: #000000;\"><strong>Bagaimana memilih K<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Secara umum, semakin banyak lipatan yang kita gunakan dalam validasi silang k-fold, semakin rendah bias tes MSE tetapi semakin tinggi variansnya. Sebaliknya, semakin sedikit lipatan yang kita gunakan, semakin tinggi biasnya namun semakin rendah variansnya. Ini adalah contoh klasik <a href=\"https:\/\/statorials.org\/id\/kompromi-varians-bias\/\" target=\"_blank\" rel=\"noopener noreferrer\">dari tradeoff bias-varians<\/a> dalam pembelajaran mesin.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Dalam praktiknya, kami biasanya memilih untuk menggunakan antara 5 dan 10 lapis. Sebagaimana dicatat dalam <a href=\"https:\/\/www.ime.unicamp.br\/~dias\/Intoduction%20to%20Statistical%20Learning.pdf\" target=\"_blank\" rel=\"noopener noreferrer\"><em>Pengantar Pembelajaran Statistik<\/em> ,<\/a> jumlah lipatan ini telah terbukti memberikan keseimbangan optimal antara bias dan varians dan dengan demikian memberikan perkiraan MSE tes yang dapat diandalkan:<\/span><\/p>\n<blockquote>\n<p> <span style=\"color: #000000;\">Ringkasnya, ada tradeoff bias-varians yang terkait dengan pilihan k dalam validasi silang k-fold.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Biasanya, dengan mempertimbangkan pertimbangan ini, seseorang melakukan validasi silang k-fold menggunakan k = 5 atau k = 10, karena nilai-nilai ini telah terbukti secara empiris menghasilkan perkiraan tingkat kesalahan pengujian yang tidak mengalami bias yang terlalu tinggi atau varians yang sangat tinggi.<\/span><\/p>\n<p> <span style=\"color: #000000;\">-Halaman 184, <em>Pengantar Pembelajaran Statistik<\/em><\/span><\/p>\n<\/blockquote>\n<h3> <span style=\"color: #000000;\"><strong>Manfaat Validasi Silang K-Fold<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Saat kita membagi kumpulan data menjadi satu set pelatihan dan satu set pengujian, MSE pengujian yang dihitung berdasarkan observasi di set pengujian dapat bervariasi secara signifikan bergantung pada observasi yang digunakan dalam set pelatihan dan pengujian.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Dengan menggunakan validasi silang k-fold, kami dapat menghitung pengujian MSE menggunakan beberapa variasi set pelatihan dan pengujian yang berbeda. Hal ini memberi kita peluang lebih besar untuk mendapatkan perkiraan MSE pengujian yang tidak bias.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Validasi silang K-fold juga memberikan keunggulan komputasi dibandingkan <a href=\"https:\/\/statorials.org\/id\/tinggalkan-satu-validasi-silang\/\" target=\"_blank\" rel=\"noopener noreferrer\">Validasi Silang Tinggalkan Satu Keluar (LOOCV)<\/a> karena hanya perlu menyesuaikan model sebanyak <em>k<\/em> kali, bukan <em>n<\/em> kali.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Untuk model yang memerlukan waktu lama untuk disesuaikan, validasi silang k-fold dapat menghitung MSE pengujian jauh lebih cepat daripada LOOCV dan dalam banyak kasus, MSE pengujian yang dihitung berdasarkan setiap pendekatan akan sangat mirip jika Anda menggunakan jumlah lipatan yang memadai.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Ekstensi Validasi Silang K-Fold<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Ada beberapa ekstensi untuk validasi silang k-fold, termasuk:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Validasi silang k-fold berulang:<\/strong> Di sinilah validasi silang k-fold diulang sebanyak <em>n<\/em> kali. Setiap kali set pelatihan dan pengujian digabungkan, hal ini semakin mengurangi bias dalam estimasi MSE pengujian, meskipun penyelesaiannya memerlukan waktu lebih lama dibandingkan validasi silang k-fold biasa.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Validasi Silang Tinggalkan Satu Keluar:<\/strong> Ini adalah kasus khusus validasi silang k-fold di mana <em>k<\/em> = <em>n<\/em> . Anda dapat mempelajari lebih lanjut tentang metode ini <a href=\"https:\/\/statorials.org\/id\/tinggalkan-satu-validasi-silang\/\" target=\"_blank\" rel=\"noopener noreferrer\">di sini<\/a> .<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Validasi silang k-fold bertingkat:<\/strong> Ini adalah versi validasi silang k-fold di mana kumpulan data disusun ulang sedemikian rupa sehingga setiap lipatan mewakili keseluruhan. Sebagaimana dicatat oleh <a href=\"https:\/\/www.researchgate.net\/publication\/2352264_A_Study_of_Cross-Validation_and_Bootstrap_for_Accuracy_Estimation_and_Model_Selection\" target=\"_blank\" rel=\"noopener noreferrer\">Kohavi<\/a> , metode ini cenderung menawarkan trade-off yang lebih baik antara bias dan varians dibandingkan dengan validasi silang k-fold biasa.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Validasi Silang Bersarang:<\/strong> Di sinilah validasi silang k-fold dilakukan di setiap lipatan validasi silang. Ini sering digunakan untuk melakukan penyetelan hyperparameter selama evaluasi model.<\/span><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Untuk mengevaluasi performa suatu model pada kumpulan data, kita perlu mengukur seberapa cocok prediksi yang dibuat oleh model tersebut dengan data yang diamati. Cara paling umum untuk mengukurnya adalah dengan menggunakan mean square error (MSE), yang dihitung sebagai berikut: MSE = (1\/n)*\u03a3(y saya \u2013 f(x saya )) 2 Emas: n: jumlah total observasi y i [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Panduan Sederhana untuk Validasi Silang K-Fold - Statorial<\/title>\n<meta name=\"description\" content=\"Tutorial ini memberikan pengenalan validasi silang k-fold, metode yang umum digunakan untuk mengevaluasi performa model dalam pembelajaran mesin.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/id\/k-lipat-validasi-silang\/\" \/>\n<meta property=\"og:locale\" content=\"id_ID\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Panduan Sederhana untuk Validasi Silang K-Fold - Statorial\" \/>\n<meta property=\"og:description\" content=\"Tutorial ini memberikan pengenalan validasi silang k-fold, metode yang umum digunakan untuk mengevaluasi performa model dalam pembelajaran mesin.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/id\/k-lipat-validasi-silang\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-27T09:50:11+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/kfold1.png\" \/>\n<meta name=\"author\" content=\"Benjamin anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Ditulis oleh\" \/>\n\t<meta name=\"twitter:data1\" content=\"Benjamin anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Estimasi waktu membaca\" \/>\n\t<meta name=\"twitter:data2\" content=\"4 menit\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/id\/k-lipat-validasi-silang\/\",\"url\":\"https:\/\/statorials.org\/id\/k-lipat-validasi-silang\/\",\"name\":\"Panduan Sederhana untuk Validasi Silang K-Fold - Statorial\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/id\/#website\"},\"datePublished\":\"2023-07-27T09:50:11+00:00\",\"dateModified\":\"2023-07-27T09:50:11+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/id\/#\/schema\/person\/3d17a1160dd2d052b7c78e502cb9ec81\"},\"description\":\"Tutorial ini memberikan pengenalan validasi silang k-fold, metode yang umum digunakan untuk mengevaluasi performa model dalam pembelajaran mesin.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/id\/k-lipat-validasi-silang\/#breadcrumb\"},\"inLanguage\":\"id\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/id\/k-lipat-validasi-silang\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/id\/k-lipat-validasi-silang\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\/\/statorials.org\/id\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Panduan sederhana untuk validasi silang k-fold\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/id\/#website\",\"url\":\"https:\/\/statorials.org\/id\/\",\"name\":\"Statorials\",\"description\":\"Panduan anda untuk kompetensi statistik!\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/id\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"id\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/id\/#\/schema\/person\/3d17a1160dd2d052b7c78e502cb9ec81\",\"name\":\"Benjamin anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"id\",\"@id\":\"https:\/\/statorials.org\/id\/#\/schema\/person\/image\/\",\"url\":\"http:\/\/statorials.org\/id\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"http:\/\/statorials.org\/id\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"caption\":\"Benjamin anderson\"},\"description\":\"Halo, saya Benjamin, pensiunan profesor statistika yang menjadi guru Statorial yang berdedikasi. Dengan pengalaman dan keahlian yang luas di bidang statistika, saya ingin berbagi ilmu untuk memberdayakan mahasiswa melalui Statorials. Baca selengkapnya\",\"sameAs\":[\"http:\/\/statorials.org\/id\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Panduan Sederhana untuk Validasi Silang K-Fold - Statorial","description":"Tutorial ini memberikan pengenalan validasi silang k-fold, metode yang umum digunakan untuk mengevaluasi performa model dalam pembelajaran mesin.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/id\/k-lipat-validasi-silang\/","og_locale":"id_ID","og_type":"article","og_title":"Panduan Sederhana untuk Validasi Silang K-Fold - Statorial","og_description":"Tutorial ini memberikan pengenalan validasi silang k-fold, metode yang umum digunakan untuk mengevaluasi performa model dalam pembelajaran mesin.","og_url":"https:\/\/statorials.org\/id\/k-lipat-validasi-silang\/","og_site_name":"Statorials","article_published_time":"2023-07-27T09:50:11+00:00","og_image":[{"url":"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/kfold1.png"}],"author":"Benjamin anderson","twitter_card":"summary_large_image","twitter_misc":{"Ditulis oleh":"Benjamin anderson","Estimasi waktu membaca":"4 menit"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/id\/k-lipat-validasi-silang\/","url":"https:\/\/statorials.org\/id\/k-lipat-validasi-silang\/","name":"Panduan Sederhana untuk Validasi Silang K-Fold - Statorial","isPartOf":{"@id":"https:\/\/statorials.org\/id\/#website"},"datePublished":"2023-07-27T09:50:11+00:00","dateModified":"2023-07-27T09:50:11+00:00","author":{"@id":"https:\/\/statorials.org\/id\/#\/schema\/person\/3d17a1160dd2d052b7c78e502cb9ec81"},"description":"Tutorial ini memberikan pengenalan validasi silang k-fold, metode yang umum digunakan untuk mengevaluasi performa model dalam pembelajaran mesin.","breadcrumb":{"@id":"https:\/\/statorials.org\/id\/k-lipat-validasi-silang\/#breadcrumb"},"inLanguage":"id","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/id\/k-lipat-validasi-silang\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/id\/k-lipat-validasi-silang\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/statorials.org\/id\/"},{"@type":"ListItem","position":2,"name":"Panduan sederhana untuk validasi silang k-fold"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/id\/#website","url":"https:\/\/statorials.org\/id\/","name":"Statorials","description":"Panduan anda untuk kompetensi statistik!","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/id\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"id"},{"@type":"Person","@id":"https:\/\/statorials.org\/id\/#\/schema\/person\/3d17a1160dd2d052b7c78e502cb9ec81","name":"Benjamin anderson","image":{"@type":"ImageObject","inLanguage":"id","@id":"https:\/\/statorials.org\/id\/#\/schema\/person\/image\/","url":"http:\/\/statorials.org\/id\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","contentUrl":"http:\/\/statorials.org\/id\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","caption":"Benjamin anderson"},"description":"Halo, saya Benjamin, pensiunan profesor statistika yang menjadi guru Statorial yang berdedikasi. Dengan pengalaman dan keahlian yang luas di bidang statistika, saya ingin berbagi ilmu untuk memberdayakan mahasiswa melalui Statorials. Baca selengkapnya","sameAs":["http:\/\/statorials.org\/id"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/posts\/1177"}],"collection":[{"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/comments?post=1177"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/posts\/1177\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/media?parent=1177"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/categories?post=1177"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/tags?post=1177"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}