{"id":2214,"date":"2023-07-23T05:43:04","date_gmt":"2023-07-23T05:43:04","guid":{"rendered":"https:\/\/statorials.org\/nl\/validatieset-versus-testset\/"},"modified":"2023-07-23T05:43:04","modified_gmt":"2023-07-23T05:43:04","slug":"validatieset-versus-testset","status":"publish","type":"post","link":"https:\/\/statorials.org\/nl\/validatieset-versus-testset\/","title":{"rendered":"Validatieset en testset: wat is het verschil?"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\">Wanneer we een machine learning-algoritme aan een dataset aanpassen, verdelen we de dataset doorgaans in drie delen:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>1. Trainingsset<\/strong> : wordt gebruikt om het model te trainen.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>2. Validatieset<\/strong> : gebruikt om modelparameters te optimaliseren.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>3. Testset<\/strong> : gebruikt om een onbevooroordeelde schatting te verkrijgen van de uiteindelijke modelprestaties.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Het volgende diagram biedt een visuele uitleg van deze drie verschillende soorten gegevenssets:<\/span> <\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\" wp-image-20317 aligncenter\" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/test_val1.png\" alt=\"\" width=\"678\" height=\"455\" srcset=\"\" sizes=\"auto, \"><\/p>\n<p> <span style=\"color: #000000;\">Een punt van verwarring bij studenten is het verschil tussen de validatieset en de testset.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Simpel gezegd wordt de <strong>validatieset<\/strong> gebruikt om de modelparameters te optimaliseren, terwijl de <strong>testset<\/strong> wordt gebruikt om een onbevooroordeelde schatting van het uiteindelijke model te geven.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Er kan worden aangetoond dat het foutenpercentage zoals gemeten door k-voudige kruisvalidatie de neiging heeft het werkelijke foutenpercentage te onderschatten zodra het model wordt toegepast op een onzichtbare dataset.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Daarom passen we het uiteindelijke model aan <strong>de testset<\/strong> aan om een onbevooroordeelde schatting te krijgen van wat het werkelijke foutenpercentage in de echte wereld zal zijn.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Het volgende voorbeeld illustreert het verschil tussen een validatieset en een testset in de praktijk.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Voorbeeld: het verschil begrijpen tussen validatieset en testset<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Laten we zeggen dat een vastgoedinvesteerder (1) het aantal slaapkamers, (2) het totale aantal vierkante meter en (3) het aantal badkamers wil gebruiken om de verkoopprijs van een bepaald huis te voorspellen.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Laten we zeggen dat hij een dataset heeft met deze informatie over 10.000 huizen. Ten eerste zal het de dataset opsplitsen in een trainingsset van 8.000 huizen en een testset van 2.000 huizen:<\/span> <\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\" wp-image-20319 aligncenter\" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/test_val2.png\" alt=\"\" width=\"673\" height=\"142\" srcset=\"\" sizes=\"auto, \"><\/p>\n<p> <span style=\"color: #000000;\">Vervolgens past het vier keer een meervoudig lineair regressiemodel aan de dataset toe. Er zullen telkens 6.000 huizen voor de trainingsset en 2.000 huizen voor de validatieset worden gebruikt.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Dit wordt <strong>k-voudige kruisvalidatie genoemd.<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">De trainingsset wordt gebruikt om het model te trainen en de validatieset wordt gebruikt om de prestaties van het model te evalueren. Voor de validatieset wordt telkens een andere groep van 2.000 huizen gebruikt.<\/span> <\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\" wp-image-20320 aligncenter\" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/test_val3.png\" alt=\"\" width=\"678\" height=\"358\" srcset=\"\" sizes=\"auto, \"><\/p>\n<p> <span style=\"color: #000000;\">Het kan deze k-voudige kruisvalidatie uitvoeren op verschillende typen regressiemodellen om het model met de laagste fout te identificeren (dwz het model te identificeren dat het beste bij de dataset past).<\/span><\/p>\n<p> <span style=\"color: #000000;\">Pas als het beste model is ge\u00efdentificeerd, zal het de testset met 2.000 woningen die het in het begin presenteerde, gebruiken om een onbevooroordeelde schatting te krijgen van de uiteindelijke prestaties van het model.<\/span> <\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\" wp-image-20321 aligncenter\" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/test_val4.png\" alt=\"\" width=\"665\" height=\"314\" srcset=\"\" sizes=\"auto, \"><\/p>\n<p> <span style=\"color: #000000;\">Het zou bijvoorbeeld een specifiek type regressiemodel kunnen identificeren waarvan de gemiddelde absolute fout <strong>8.345<\/strong> is. Dat wil zeggen dat het gemiddelde absolute verschil tussen de voorspelde huizenprijs en de werkelijke huizenprijs $8.345 bedraagt.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Vervolgens kan hij dit exacte regressiemodel inpassen in de testset van 2.000 huizen die nog niet zijn gebruikt en vaststellen dat de gemiddelde absolute fout van het model <strong>8,847<\/strong> bedraagt.<\/span><\/p>\n<p> <span style=\"color: #000000;\">De onbevooroordeelde schatting van de werkelijke gemiddelde absolute fout van het model bedraagt dus $8.847.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Aanvullende bronnen<\/strong><\/span><\/h3>\n<p> <a href=\"https:\/\/statorials.org\/nl\/k-voudige-kruisvalidatie\/\" target=\"_blank\" rel=\"noopener\">Een eenvoudige handleiding voor kruisvalidatie met K-vouwen<\/a><br \/> <a href=\"https:\/\/statorials.org\/nl\/k-voudige-kruisvalidatie-in-python\/\">Hoe K-Fold kruisvalidatie uit te voeren in Python<\/a><br \/> <a href=\"https:\/\/statorials.org\/nl\/k-voudige-kruisvalidatie-in-r\/\" target=\"_blank\" rel=\"noopener\">Hoe K-Fold kruisvalidatie uit te voeren in R<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Wanneer we een machine learning-algoritme aan een dataset aanpassen, verdelen we de dataset doorgaans in drie delen: 1. Trainingsset : wordt gebruikt om het model te trainen. 2. Validatieset : gebruikt om modelparameters te optimaliseren. 3. Testset : gebruikt om een onbevooroordeelde schatting te verkrijgen van de uiteindelijke modelprestaties. Het volgende diagram biedt een visuele [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"class_list":["post-2214","post","type-post","status-publish","format-standard","hentry","category-gids"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Validatieset en testset: wat is het verschil? - Statorialen<\/title>\n<meta name=\"description\" content=\"In deze tutorial wordt met een voorbeeld het verschil uitgelegd tussen een validatieset en een testset bij machine learning.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/nl\/validatieset-versus-testset\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Validatieset en testset: wat is het verschil? - Statorialen\" \/>\n<meta property=\"og:description\" content=\"In deze tutorial wordt met een voorbeeld het verschil uitgelegd tussen een validatieset en een testset bij machine learning.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/nl\/validatieset-versus-testset\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-23T05:43:04+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/test_val1.png\" \/>\n<meta name=\"author\" content=\"Dr.benjamin anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"Dr.benjamin anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"2\u00a0Minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/nl\/validatieset-versus-testset\/\",\"url\":\"https:\/\/statorials.org\/nl\/validatieset-versus-testset\/\",\"name\":\"Validatieset en testset: wat is het verschil? - Statorialen\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/nl\/#website\"},\"datePublished\":\"2023-07-23T05:43:04+00:00\",\"dateModified\":\"2023-07-23T05:43:04+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\"},\"description\":\"In deze tutorial wordt met een voorbeeld het verschil uitgelegd tussen een validatieset en een testset bij machine learning.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/nl\/validatieset-versus-testset\/#breadcrumb\"},\"inLanguage\":\"de\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/nl\/validatieset-versus-testset\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/nl\/validatieset-versus-testset\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Thuis\",\"item\":\"https:\/\/statorials.org\/nl\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Validatieset en testset: wat is het verschil?\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/nl\/#website\",\"url\":\"https:\/\/statorials.org\/nl\/\",\"name\":\"Statorials\",\"description\":\"Uw gids voor statistische competentie\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/nl\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"de\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\",\"name\":\"Dr.benjamin anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/\",\"url\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"caption\":\"Dr.benjamin anderson\"},\"description\":\"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder\",\"sameAs\":[\"http:\/\/statorials.org\/nl\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Validatieset en testset: wat is het verschil? - Statorialen","description":"In deze tutorial wordt met een voorbeeld het verschil uitgelegd tussen een validatieset en een testset bij machine learning.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/nl\/validatieset-versus-testset\/","og_locale":"de_DE","og_type":"article","og_title":"Validatieset en testset: wat is het verschil? - Statorialen","og_description":"In deze tutorial wordt met een voorbeeld het verschil uitgelegd tussen een validatieset en een testset bij machine learning.","og_url":"https:\/\/statorials.org\/nl\/validatieset-versus-testset\/","og_site_name":"Statorials","article_published_time":"2023-07-23T05:43:04+00:00","og_image":[{"url":"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/test_val1.png"}],"author":"Dr.benjamin anderson","twitter_card":"summary_large_image","twitter_misc":{"Verfasst von":"Dr.benjamin anderson","Gesch\u00e4tzte Lesezeit":"2\u00a0Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/nl\/validatieset-versus-testset\/","url":"https:\/\/statorials.org\/nl\/validatieset-versus-testset\/","name":"Validatieset en testset: wat is het verschil? - Statorialen","isPartOf":{"@id":"https:\/\/statorials.org\/nl\/#website"},"datePublished":"2023-07-23T05:43:04+00:00","dateModified":"2023-07-23T05:43:04+00:00","author":{"@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219"},"description":"In deze tutorial wordt met een voorbeeld het verschil uitgelegd tussen een validatieset en een testset bij machine learning.","breadcrumb":{"@id":"https:\/\/statorials.org\/nl\/validatieset-versus-testset\/#breadcrumb"},"inLanguage":"de","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/nl\/validatieset-versus-testset\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/nl\/validatieset-versus-testset\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Thuis","item":"https:\/\/statorials.org\/nl\/"},{"@type":"ListItem","position":2,"name":"Validatieset en testset: wat is het verschil?"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/nl\/#website","url":"https:\/\/statorials.org\/nl\/","name":"Statorials","description":"Uw gids voor statistische competentie","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/nl\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"de"},{"@type":"Person","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219","name":"Dr.benjamin anderson","image":{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/","url":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","contentUrl":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","caption":"Dr.benjamin anderson"},"description":"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder","sameAs":["http:\/\/statorials.org\/nl"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/2214","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/comments?post=2214"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/2214\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/media?parent=2214"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/categories?post=2214"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/tags?post=2214"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}