{"id":1176,"date":"2023-07-27T09:50:11","date_gmt":"2023-07-27T09:50:11","guid":{"rendered":"https:\/\/statorials.org\/it\/k-piega-convalida-incrociata\/"},"modified":"2023-07-27T09:50:11","modified_gmt":"2023-07-27T09:50:11","slug":"k-piega-convalida-incrociata","status":"publish","type":"post","link":"https:\/\/statorials.org\/it\/k-piega-convalida-incrociata\/","title":{"rendered":"Una semplice guida alla convalida incrociata di k-fold"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\">Per valutare le prestazioni di un modello su un set di dati, dobbiamo misurare quanto bene le previsioni fatte dal modello corrispondono ai dati osservati.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Il modo pi\u00f9 comune per misurarlo \u00e8 utilizzare l\u2019errore quadratico medio (MSE), che viene calcolato come segue:<\/span><\/p>\n<p> <span style=\"color: #000000;\">MSE = (1\/n)*\u03a3(y <sub>i<\/sub> \u2013 f(x <sub>i<\/sub> )) <sup>2<\/sup><\/span><\/p>\n<p> <span style=\"color: #000000;\">Oro:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\"><strong>n:<\/strong> numero totale di osservazioni<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>y <sub>i<\/sub> :<\/strong> il valore di risposta dell&#8217;i <sup>-esima<\/sup> osservazione<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>f( <sub>xi<\/sub> ):<\/strong> Il valore di risposta previsto dell&#8217;i- <sup>esima<\/sup> osservazione<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Pi\u00f9 le previsioni del modello si avvicinano alle osservazioni, pi\u00f9 basso sar\u00e0 il MSE.<\/span><\/p>\n<p> <span style=\"color: #000000;\">In pratica, utilizziamo il seguente processo per calcolare l\u2019MSE di un dato modello:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>1.<\/strong> Dividere un set di dati in un set di training e un set di test.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>2.<\/strong> Crea il modello utilizzando solo i dati del set di training.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>3.<\/strong> Utilizzare il modello per fare previsioni sul set di test e misurare l&#8217;MSE del test.<\/span><\/p>\n<p> <span style=\"color: #000000;\">I test MSE ci danno un&#8217;idea delle prestazioni di un modello su dati mai visti prima. Tuttavia, lo svantaggio di utilizzare un singolo set di test \u00e8 che il test MSE pu\u00f2 variare in modo significativo a seconda delle osservazioni utilizzate nei set di training e di test.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Un modo per evitare questo problema \u00e8 adattare un modello pi\u00f9 volte utilizzando ogni volta un set di training e test diverso, quindi calcolare l&#8217;MSE di test come media di tutti gli MSE di test.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Questo metodo generale \u00e8 noto come convalida incrociata e una sua forma specifica \u00e8 nota come <b>convalida incrociata k-fold<\/b> .<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Convalida incrociata K-Fold<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\"><strong>La convalida incrociata K-fold<\/strong> utilizza il seguente approccio per valutare un modello:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Passaggio 1: dividere casualmente un set di dati in <em>k<\/em> gruppi, o &#8220;pieghe&#8221;, di dimensioni approssimativamente uguali.<\/strong><\/span> <\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-11712 \" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/kfold1.png\" alt=\"Dividere un set di dati in k pieghe\" width=\"530\" height=\"133\" srcset=\"\" sizes=\"\"><\/p>\n<p> <span style=\"color: #000000;\"><strong>Passaggio 2: scegli una delle pieghe come set di attesa. Adatta il modello alle restanti pieghe k-1. Calcolare il test MSE sulle osservazioni nello strato che \u00e8 stato tensionato.<\/strong><\/span> <\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-11713 \" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/kfold2.png\" alt=\"validazione incrociata k-fold\" width=\"550\" height=\"174\" srcset=\"\" sizes=\"\"><\/p>\n<p> <span style=\"color: #000000;\"><strong>Passaggio 3: ripetere questo processo <em>k<\/em> volte, ogni volta utilizzando un set diverso come set di esclusione.<\/strong><\/span> <\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-11714 \" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/kfold3.png\" alt=\"Esempio di convalida incrociata k-fold\" width=\"618\" height=\"234\" srcset=\"\" sizes=\"\"><\/p>\n<p> <span style=\"color: #000000;\"><strong>Passaggio 4: calcolare l&#8217;MSE complessivo del test come media dei <em>k<\/em> MSE del test.<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Prova MSE = (1\/k)*\u03a3MSE <sub>i<\/sub><\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Oro:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\"><strong>k:<\/strong> numero di pieghe<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>MSE <sub>i<\/sub><\/strong> : testa MSE all&#8217;i <sup>-esima<\/sup> iterazione<\/span><\/li>\n<\/ul>\n<h3> <span style=\"color: #000000;\"><strong>Come scegliere K<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">In generale, pi\u00f9 pieghe utilizziamo nella convalida incrociata k-fold, minore \u00e8 la distorsione del test MSE ma maggiore \u00e8 la varianza. Al contrario, meno pieghe utilizziamo, maggiore \u00e8 il bias ma minore \u00e8 la varianza. Questo \u00e8 un classico esempio <a href=\"https:\/\/statorials.org\/it\/compromesso-della-varianza-del-bias\/\" target=\"_blank\" rel=\"noopener noreferrer\">del compromesso bias-varianza<\/a> nell\u2019apprendimento automatico.<\/span><\/p>\n<p> <span style=\"color: #000000;\">In pratica, generalmente scegliamo di utilizzare tra 5 e 10 veli. Come notato in <a href=\"https:\/\/www.ime.unicamp.br\/~dias\/Intoduction%20to%20Statistical%20Learning.pdf\" target=\"_blank\" rel=\"noopener noreferrer\"><em>An Introduction to Statistical Learning<\/em> ,<\/a> \u00e8 stato dimostrato che questo numero di pieghe fornisce un equilibrio ottimale tra bias e varianza e quindi fornisce stime affidabili dell&#8217;MSE del test:<\/span><\/p>\n<blockquote>\n<p> <span style=\"color: #000000;\">Per riassumere, esiste un compromesso bias-varianza associato alla scelta di k nella convalida incrociata k-fold.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Tipicamente, date queste considerazioni, si esegue una validazione incrociata k-fold utilizzando k = 5 o k = 10, poich\u00e9 \u00e8 stato dimostrato empiricamente che questi valori producono stime del tasso di errore del test che non subiscono n\u00e9 bias eccessivamente elevati n\u00e9 varianza molto elevata.<\/span><\/p>\n<p> <span style=\"color: #000000;\">-Pagina 184, <em>Un&#8217;introduzione all&#8217;apprendimento statistico<\/em><\/span><\/p>\n<\/blockquote>\n<h3> <span style=\"color: #000000;\"><strong>Vantaggi della convalida incrociata K-Fold<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Quando dividiamo un set di dati in un singolo set di training e in un singolo set di test, il test MSE calcolato sulle osservazioni nel set di test pu\u00f2 variare in modo significativo a seconda delle osservazioni utilizzate nei set di training e di test.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Utilizzando la convalida incrociata k-fold, siamo in grado di calcolare il test MSE utilizzando diverse varianti di set di training e test. Questo ci d\u00e0 una possibilit\u00e0 molto maggiore di ottenere una stima imparziale del MSE del test.<\/span><\/p>\n<p> <span style=\"color: #000000;\">La convalida incrociata K-fold fornisce anche un vantaggio computazionale rispetto alla <a href=\"https:\/\/statorials.org\/it\/lasciare-una-singola-convalida-incrociata\/\" target=\"_blank\" rel=\"noopener noreferrer\">convalida incrociata Leave-One-Out (LOOCV)<\/a> perch\u00e9 deve adattarsi a un modello solo <em>k<\/em> volte anzich\u00e9 <em>n<\/em> volte.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Per i modelli che richiedono molto tempo per adattarsi, la convalida incrociata k-fold pu\u00f2 calcolare il test MSE molto pi\u00f9 velocemente di LOOCV e in molti casi il test MSE calcolato da ciascun approccio sar\u00e0 abbastanza simile se si utilizza un numero sufficiente di pieghe.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Estensioni di convalida incrociata K-Fold<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Esistono diverse estensioni alla convalida incrociata k-fold, tra cui:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Convalida incrociata k-fold ripetuta:<\/strong> \u00e8 qui che la convalida incrociata k-fold viene semplicemente ripetuta <em>n<\/em> volte. Ogni volta che i set di training e test vengono mischiati, ci\u00f2 riduce ulteriormente la distorsione nella stima MSE del test, sebbene ci\u00f2 richieda pi\u00f9 tempo per essere completato rispetto alla normale convalida incrociata k-fold.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Convalida incrociata Leave-One-Out:<\/strong> questo \u00e8 un caso speciale di convalida incrociata k-fold in cui <em>k<\/em> = <em>n<\/em> . Puoi saperne di pi\u00f9 su questo metodo <a href=\"https:\/\/statorials.org\/it\/lasciare-una-singola-convalida-incrociata\/\" target=\"_blank\" rel=\"noopener noreferrer\">qui<\/a> .<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Convalida incrociata k-fold stratificata:<\/strong> questa \u00e8 una versione della convalida incrociata k-fold in cui il set di dati viene riorganizzato in modo tale che ciascuna piega sia rappresentativa dell&#8217;intero. Come notato da <a href=\"https:\/\/www.researchgate.net\/publication\/2352264_A_Study_of_Cross-Validation_and_Bootstrap_for_Accuracy_Estimation_and_Model_Selection\" target=\"_blank\" rel=\"noopener noreferrer\">Kohavi<\/a> , questo metodo tende a offrire un migliore compromesso tra bias e varianza rispetto alla normale convalida incrociata k-fold.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Convalida incrociata nidificata:<\/strong> \u00e8 qui che viene eseguita la convalida incrociata k-fold in ogni piega di convalida incrociata. Viene spesso utilizzato per eseguire l&#8217;ottimizzazione degli iperparametri durante la valutazione del modello.<\/span><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Per valutare le prestazioni di un modello su un set di dati, dobbiamo misurare quanto bene le previsioni fatte dal modello corrispondono ai dati osservati. Il modo pi\u00f9 comune per misurarlo \u00e8 utilizzare l\u2019errore quadratico medio (MSE), che viene calcolato come segue: MSE = (1\/n)*\u03a3(y i \u2013 f(x i )) 2 Oro: n: numero totale [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Una semplice guida alla convalida incrociata K-Fold - Statorials<\/title>\n<meta name=\"description\" content=\"Questo tutorial fornisce un&#039;introduzione alla convalida incrociata k-fold, un metodo comunemente utilizzato per valutare le prestazioni del modello nell&#039;apprendimento automatico.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/it\/k-piega-convalida-incrociata\/\" \/>\n<meta property=\"og:locale\" content=\"it_IT\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Una semplice guida alla convalida incrociata K-Fold - Statorials\" \/>\n<meta property=\"og:description\" content=\"Questo tutorial fornisce un&#039;introduzione alla convalida incrociata k-fold, un metodo comunemente utilizzato per valutare le prestazioni del modello nell&#039;apprendimento automatico.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/it\/k-piega-convalida-incrociata\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-27T09:50:11+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/kfold1.png\" \/>\n<meta name=\"author\" content=\"Benjamin anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Written by\" \/>\n\t<meta name=\"twitter:data1\" content=\"Benjamin anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Est. reading time\" \/>\n\t<meta name=\"twitter:data2\" content=\"4 minuti\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/it\/k-piega-convalida-incrociata\/\",\"url\":\"https:\/\/statorials.org\/it\/k-piega-convalida-incrociata\/\",\"name\":\"Una semplice guida alla convalida incrociata K-Fold - Statorials\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/it\/#website\"},\"datePublished\":\"2023-07-27T09:50:11+00:00\",\"dateModified\":\"2023-07-27T09:50:11+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/it\/#\/schema\/person\/0896f191fb9fb019f2cd8623112cb3ae\"},\"description\":\"Questo tutorial fornisce un&#39;introduzione alla convalida incrociata k-fold, un metodo comunemente utilizzato per valutare le prestazioni del modello nell&#39;apprendimento automatico.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/it\/k-piega-convalida-incrociata\/#breadcrumb\"},\"inLanguage\":\"it-IT\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/it\/k-piega-convalida-incrociata\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/it\/k-piega-convalida-incrociata\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Casa\",\"item\":\"https:\/\/statorials.org\/it\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Una semplice guida alla convalida incrociata di k-fold\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/it\/#website\",\"url\":\"https:\/\/statorials.org\/it\/\",\"name\":\"Statorials\",\"description\":\"La tua guida all&#039;alfabetizzazione statistica!\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/it\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"it-IT\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/it\/#\/schema\/person\/0896f191fb9fb019f2cd8623112cb3ae\",\"name\":\"Benjamin anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"it-IT\",\"@id\":\"https:\/\/statorials.org\/it\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/statorials.org\/it\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"https:\/\/statorials.org\/it\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"caption\":\"Benjamin anderson\"},\"description\":\"Ciao, sono Benjamin, un professore di statistica in pensione diventato insegnante dedicato di Statorials. Con una vasta esperienza e competenza nel campo della statistica, sono ansioso di condividere le mie conoscenze per potenziare gli studenti attraverso Statorials. Scopri di pi\u00f9\",\"sameAs\":[\"https:\/\/statorials.org\/it\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Una semplice guida alla convalida incrociata K-Fold - Statorials","description":"Questo tutorial fornisce un&#39;introduzione alla convalida incrociata k-fold, un metodo comunemente utilizzato per valutare le prestazioni del modello nell&#39;apprendimento automatico.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/it\/k-piega-convalida-incrociata\/","og_locale":"it_IT","og_type":"article","og_title":"Una semplice guida alla convalida incrociata K-Fold - Statorials","og_description":"Questo tutorial fornisce un&#39;introduzione alla convalida incrociata k-fold, un metodo comunemente utilizzato per valutare le prestazioni del modello nell&#39;apprendimento automatico.","og_url":"https:\/\/statorials.org\/it\/k-piega-convalida-incrociata\/","og_site_name":"Statorials","article_published_time":"2023-07-27T09:50:11+00:00","og_image":[{"url":"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/kfold1.png"}],"author":"Benjamin anderson","twitter_card":"summary_large_image","twitter_misc":{"Written by":"Benjamin anderson","Est. reading time":"4 minuti"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/it\/k-piega-convalida-incrociata\/","url":"https:\/\/statorials.org\/it\/k-piega-convalida-incrociata\/","name":"Una semplice guida alla convalida incrociata K-Fold - Statorials","isPartOf":{"@id":"https:\/\/statorials.org\/it\/#website"},"datePublished":"2023-07-27T09:50:11+00:00","dateModified":"2023-07-27T09:50:11+00:00","author":{"@id":"https:\/\/statorials.org\/it\/#\/schema\/person\/0896f191fb9fb019f2cd8623112cb3ae"},"description":"Questo tutorial fornisce un&#39;introduzione alla convalida incrociata k-fold, un metodo comunemente utilizzato per valutare le prestazioni del modello nell&#39;apprendimento automatico.","breadcrumb":{"@id":"https:\/\/statorials.org\/it\/k-piega-convalida-incrociata\/#breadcrumb"},"inLanguage":"it-IT","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/it\/k-piega-convalida-incrociata\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/it\/k-piega-convalida-incrociata\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Casa","item":"https:\/\/statorials.org\/it\/"},{"@type":"ListItem","position":2,"name":"Una semplice guida alla convalida incrociata di k-fold"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/it\/#website","url":"https:\/\/statorials.org\/it\/","name":"Statorials","description":"La tua guida all&#039;alfabetizzazione statistica!","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/it\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"it-IT"},{"@type":"Person","@id":"https:\/\/statorials.org\/it\/#\/schema\/person\/0896f191fb9fb019f2cd8623112cb3ae","name":"Benjamin anderson","image":{"@type":"ImageObject","inLanguage":"it-IT","@id":"https:\/\/statorials.org\/it\/#\/schema\/person\/image\/","url":"https:\/\/statorials.org\/it\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","contentUrl":"https:\/\/statorials.org\/it\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","caption":"Benjamin anderson"},"description":"Ciao, sono Benjamin, un professore di statistica in pensione diventato insegnante dedicato di Statorials. Con una vasta esperienza e competenza nel campo della statistica, sono ansioso di condividere le mie conoscenze per potenziare gli studenti attraverso Statorials. Scopri di pi\u00f9","sameAs":["https:\/\/statorials.org\/it"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/posts\/1176"}],"collection":[{"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/comments?post=1176"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/posts\/1176\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/media?parent=1176"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/categories?post=1176"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/tags?post=1176"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}