{"id":1182,"date":"2023-07-27T09:18:03","date_gmt":"2023-07-27T09:18:03","guid":{"rendered":"https:\/\/statorials.org\/nl\/selectie-per-fase\/"},"modified":"2023-07-27T09:18:03","modified_gmt":"2023-07-27T09:18:03","slug":"selectie-per-fase","status":"publish","type":"post","link":"https:\/\/statorials.org\/nl\/selectie-per-fase\/","title":{"rendered":"Wat is gefaseerde selectie? (uitleg &amp; voorbeelden)"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\">Op het gebied van machine learning is het ons doel om een model te cre\u00ebren dat effectief een reeks voorspellende variabelen kan gebruiken om de waarde van een <a href=\"https:\/\/statorials.org\/nl\/variabelen-verklarende-reacties\/\" target=\"_blank\" rel=\"noopener noreferrer\">responsvariabele<\/a> te voorspellen.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Gegeven een reeks <em>p<\/em> totale voorspellende variabelen, zijn er veel modellen die we potentieel zouden kunnen bouwen.<\/span> <span style=\"color: #000000;\">E\u00e9n methode die we kunnen gebruiken om het beste model te selecteren, staat bekend als <a href=\"https:\/\/statorials.org\/nl\/beste-selectie-van-subsets\/\" target=\"_blank\" rel=\"noopener noreferrer\">best subset-selectie<\/a> , waarbij wordt geprobeerd het beste model te kiezen uit <em>alle<\/em> mogelijke modellen die met de set voorspellers kunnen worden gebouwd.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Helaas heeft deze methode twee nadelen:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Dit kan rekenintensief zijn. Voor een set <em>p-<\/em> voorspellingsvariabelen zijn er twee <sup>p<\/sup> mogelijke modellen. Met 10 voorspellende variabelen zijn er bijvoorbeeld 2 <sup>10<\/sup> = 1000 mogelijke modellen om te overwegen.<\/span><\/li>\n<li> <span style=\"color: #000000;\">Omdat het een zeer groot aantal modellen in overweging neemt, kan het potentieel een model vinden dat goed presteert op basis van trainingsgegevens, maar niet op basis van toekomstige gegevens. Dit zou <a href=\"https:\/\/statorials.org\/nl\/overfitting-van-machine-learning\/\" target=\"_blank\" rel=\"noopener noreferrer\">tot overfitting<\/a> kunnen leiden.<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Een alternatief voor het selecteren van de beste subset staat bekend als <strong>stapsgewijze selectie<\/strong> , waarbij een veel kleinere set modellen wordt vergeleken.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Er zijn twee soorten stapselectiemethoden: voorwaartse stapselectie en achterwaartse stapselectie.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Stap voor stap vooruit selecteren<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Stapsgewijze voorwaartse selectie werkt als volgt:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>1.<\/strong> Laat M <sub>0<\/sub> het nulmodel zijn, dat geen voorspellende variabele bevat.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>2.<\/strong> Voor k = 0, 2, \u2026 p-1:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Voorzie alle pk-modellen die de voorspellers in M <sub>k<\/sub> vergroten met een extra voorspellervariabele.<\/span><\/li>\n<li> <span style=\"color: #000000;\">Kies uit deze pk-modellen de beste en noem deze M <sub>k+1<\/sub> . Definieer \u201cbeste\u201d als het model met de hoogste R <sup>2<\/sup> of, op equivalente wijze, de laagste RSS.<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\"><strong>3.<\/strong> Selecteer \u00e9\u00e9n enkel beste model uit M <sub>0<\/sub> \u2026 M <sub>p<\/sub> met behulp van kruisvalidatie-voorspellingsfouten, Cp, BIC, AIC of aangepaste R <sup>2<\/sup> .<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Stap-voor-stap achterwaartse selectie<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Achterwaartse stapselectie werkt als volgt:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>1.<\/strong> Laat M <sub>p<\/sub> het volledige model zijn, dat alle <em>p<\/em> voorspellende variabelen bevat.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>2.<\/strong> Voor k = p, p-1, \u2026 1:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Pas alle k-modellen toe die op \u00e9\u00e9n na alle voorspellers in <sub>Mk<\/sub> bevatten, voor een totaal van k-1 voorspellervariabelen.<\/span><\/li>\n<li> <span style=\"color: #000000;\">Kies de beste uit deze k-modellen en noem deze M <sub>k-1<\/sub> . Definieer \u201cbeste\u201d als het model met de hoogste R <sup>2<\/sup> of, op equivalente wijze, de laagste RSS.<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\"><strong>3.<\/strong> Selecteer \u00e9\u00e9n enkel beste model uit M <sub>0<\/sub> \u2026 M <sub>p<\/sub> met behulp van kruisvalidatie-voorspellingsfouten, Cp, BIC, AIC of aangepaste R <sup>2<\/sup> .<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Criteria voor het kiezen van het \u201cbeste\u201d model<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">De laatste stap van de stapsgewijze voorwaartse en achterwaartse selectie is het kiezen van het model met de laagste voorspellingsfout, de laagste Cp, de laagste BIC, de hoogste AIC laag of de hoogste aangepaste <sup>R2<\/sup> .<\/span><\/p>\n<p> <span style=\"color: #000000;\">Hier volgen de formules die worden gebruikt om elk van deze statistieken te berekenen:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Cp:<\/strong> (RSS+2d\u03c3\u0302) \/ n<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>AIC:<\/strong> (RSS+2d\u03c3\u0302 <sup>2<\/sup> ) \/ (n\u03c3\u0302 <sup>2<\/sup> )<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>BIC:<\/strong> (RSS+log(n)d\u03c3\u0302 <sup>2<\/sup> ) \/ n<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>R <sup>2<\/sup> aangepast:<\/strong> 1 \u2013 ( (RSS \/ (nd-1)) \/ (TSS \/ (n-1)) )<\/span><\/p>\n<p> <span style=\"color: #000000;\">Goud:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\"><strong>d:<\/strong> Het aantal voorspellers<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>n:<\/strong> Totaal aantal waarnemingen<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>\u03c3\u0302:<\/strong> schatting van de foutvariantie die is gekoppeld aan elke responsmaatstaf in een regressiemodel<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>RSS:<\/strong> Residuele som van kwadraten uit het regressiemodel<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>TSS:<\/strong> Totale som van kwadraten van het regressiemodel<\/span><\/li>\n<\/ul>\n<h3> <span style=\"color: #000000;\"><strong>Voor- en nadelen van gefaseerde selectie<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Gefaseerde selectie biedt de volgende <strong>voordelen<\/strong> :<\/span><\/p>\n<p> <span style=\"color: #000000;\">Deze methode is rekentechnisch effici\u00ebnter dan het selecteren van de beste subset. Gegeven <em>p-<\/em> voorspellingsvariabelen moet de selectie van de beste subset overeenkomen met <sup>2p-<\/sup> modellen.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Omgekeerd zou stapsgewijze selectie alleen geschikt moeten zijn voor 1+p(p+ 1)\/2-modellen. Voor p = 10 voorspellende variabelen zou de beste subsetselectie in 1000 modellen moeten passen, terwijl stapsgewijze selectie slechts in 56 modellen zou moeten passen.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Gefaseerde selectie heeft echter het <strong>volgende potenti\u00eble nadeel:<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Het is niet gegarandeerd dat u tussen alle potenti\u00eble <sup>2p-<\/sup> modellen het best mogelijke model zult vinden.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Stel dat we een dataset hebben met p = 3 voorspellers. Het best mogelijke model met \u00e9\u00e9n voorspeller kan x <sub>1<\/sub> bevatten en het best mogelijke model met twee voorspellers kan in plaats daarvan x <sub>1<\/sub> en x <sub>2<\/sub> bevatten.<\/span><\/p>\n<p> <span style=\"color: #000000;\">In dit geval zal de voorwaartse stapsgewijze selectie er niet in slagen het best mogelijke model met twee voorspellers te selecteren, omdat M <sub>1<\/sub> x <sub>1<\/sub> zal bevatten, dus M <sub>2<\/sub> moet ook x <sub>1<\/sub> bevatten, evenals een andere variabele.<\/span><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Op het gebied van machine learning is het ons doel om een model te cre\u00ebren dat effectief een reeks voorspellende variabelen kan gebruiken om de waarde van een responsvariabele te voorspellen. Gegeven een reeks p totale voorspellende variabelen, zijn er veel modellen die we potentieel zouden kunnen bouwen. E\u00e9n methode die we kunnen gebruiken om [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"class_list":["post-1182","post","type-post","status-publish","format-standard","hentry","category-gids"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Wat is gefaseerde selectie? (Uitleg en voorbeelden)<\/title>\n<meta name=\"description\" content=\"Deze tutorial geeft een stapsgewijze uitleg van de modelselectie met een voorbeeld.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/nl\/selectie-per-fase\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Wat is gefaseerde selectie? (Uitleg en voorbeelden)\" \/>\n<meta property=\"og:description\" content=\"Deze tutorial geeft een stapsgewijze uitleg van de modelselectie met een voorbeeld.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/nl\/selectie-per-fase\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-27T09:18:03+00:00\" \/>\n<meta name=\"author\" content=\"Dr.benjamin anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"Dr.benjamin anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"3\u00a0Minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/nl\/selectie-per-fase\/\",\"url\":\"https:\/\/statorials.org\/nl\/selectie-per-fase\/\",\"name\":\"Wat is gefaseerde selectie? (Uitleg en voorbeelden)\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/nl\/#website\"},\"datePublished\":\"2023-07-27T09:18:03+00:00\",\"dateModified\":\"2023-07-27T09:18:03+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\"},\"description\":\"Deze tutorial geeft een stapsgewijze uitleg van de modelselectie met een voorbeeld.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/nl\/selectie-per-fase\/#breadcrumb\"},\"inLanguage\":\"de\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/nl\/selectie-per-fase\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/nl\/selectie-per-fase\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Thuis\",\"item\":\"https:\/\/statorials.org\/nl\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Wat is gefaseerde selectie? (uitleg &amp; voorbeelden)\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/nl\/#website\",\"url\":\"https:\/\/statorials.org\/nl\/\",\"name\":\"Statorials\",\"description\":\"Uw gids voor statistische competentie\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/nl\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"de\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\",\"name\":\"Dr.benjamin anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/\",\"url\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"caption\":\"Dr.benjamin anderson\"},\"description\":\"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder\",\"sameAs\":[\"http:\/\/statorials.org\/nl\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Wat is gefaseerde selectie? (Uitleg en voorbeelden)","description":"Deze tutorial geeft een stapsgewijze uitleg van de modelselectie met een voorbeeld.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/nl\/selectie-per-fase\/","og_locale":"de_DE","og_type":"article","og_title":"Wat is gefaseerde selectie? (Uitleg en voorbeelden)","og_description":"Deze tutorial geeft een stapsgewijze uitleg van de modelselectie met een voorbeeld.","og_url":"https:\/\/statorials.org\/nl\/selectie-per-fase\/","og_site_name":"Statorials","article_published_time":"2023-07-27T09:18:03+00:00","author":"Dr.benjamin anderson","twitter_card":"summary_large_image","twitter_misc":{"Verfasst von":"Dr.benjamin anderson","Gesch\u00e4tzte Lesezeit":"3\u00a0Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/nl\/selectie-per-fase\/","url":"https:\/\/statorials.org\/nl\/selectie-per-fase\/","name":"Wat is gefaseerde selectie? (Uitleg en voorbeelden)","isPartOf":{"@id":"https:\/\/statorials.org\/nl\/#website"},"datePublished":"2023-07-27T09:18:03+00:00","dateModified":"2023-07-27T09:18:03+00:00","author":{"@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219"},"description":"Deze tutorial geeft een stapsgewijze uitleg van de modelselectie met een voorbeeld.","breadcrumb":{"@id":"https:\/\/statorials.org\/nl\/selectie-per-fase\/#breadcrumb"},"inLanguage":"de","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/nl\/selectie-per-fase\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/nl\/selectie-per-fase\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Thuis","item":"https:\/\/statorials.org\/nl\/"},{"@type":"ListItem","position":2,"name":"Wat is gefaseerde selectie? (uitleg &amp; voorbeelden)"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/nl\/#website","url":"https:\/\/statorials.org\/nl\/","name":"Statorials","description":"Uw gids voor statistische competentie","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/nl\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"de"},{"@type":"Person","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219","name":"Dr.benjamin anderson","image":{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/","url":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","contentUrl":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","caption":"Dr.benjamin anderson"},"description":"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder","sameAs":["http:\/\/statorials.org\/nl"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/1182","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/comments?post=1182"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/1182\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/media?parent=1182"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/categories?post=1182"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/tags?post=1182"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}