{"id":3140,"date":"2023-07-19T00:50:54","date_gmt":"2023-07-19T00:50:54","guid":{"rendered":"https:\/\/statorials.org\/nl\/voorwaartse-selectie\/"},"modified":"2023-07-19T00:50:54","modified_gmt":"2023-07-19T00:50:54","slug":"voorwaartse-selectie","status":"publish","type":"post","link":"https:\/\/statorials.org\/nl\/voorwaartse-selectie\/","title":{"rendered":"Wat is directe selectie? (definitie &amp; #038; voorbeeld)"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\">In de statistiek is <strong>stapsgewijze selectie<\/strong> een procedure die we kunnen gebruiken om een <a href=\"https:\/\/statorials.org\/nl\/meerdere-lineaire-regressie\/\" target=\"_blank\" rel=\"noopener noreferrer\">regressiemodel<\/a> te construeren uit een reeks voorspellende variabelen door voorspellers stap voor stap in het model in te voeren en te verwijderen totdat er geen statistisch geldige reden meer is om in te voeren of verwijder er meer.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Het doel van stapsgewijze selectie is het cre\u00ebren van een regressiemodel dat alle voorspellende variabelen omvat die statistisch significant gerelateerd zijn aan de <a href=\"https:\/\/statorials.org\/nl\/variabelen-verklarende-reacties\/\" target=\"_blank\" rel=\"noopener noreferrer\">responsvariabele<\/a> .<\/span><\/p>\n<p> <span style=\"color: #000000;\"><span style=\"color: #000000;\">Een van de meest gebruikte stapsgewijze selectiemethoden staat bekend als <strong>directe selectie<\/strong> en werkt als volgt:<\/span><\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Stap 1:<\/strong> Pas een regressiemodel toe dat alleen onderschept, zonder voorspellende variabelen. Bereken de AIC <strong>*<\/strong> -waarde voor het model.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Stap 2:<\/strong> Pas alle mogelijke regressiemodellen met \u00e9\u00e9n voorspeller toe. Identificeer het model dat de laagste AIC produceerde en ook een statistisch significante vermindering van de AIC had vergeleken met het model dat alleen onderschept.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Stap 3:<\/strong> Pas alle regressiemodellen aan twee mogelijke voorspellers aan. Identificeer het model dat de laagste AIC produceerde en ook een statistisch significante vermindering van de AIC had vergeleken met het model met \u00e9\u00e9n voorspeller.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Herhaal het proces totdat het aanpassen van een regressiemodel met meer voorspellende variabelen niet langer leidt tot een statistisch significante vermindering van de AIC.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>*<\/strong> Er zijn verschillende meetgegevens die u kunt gebruiken om de goodness of fit van een regressiemodel te berekenen, waaronder kruisvalidatie-voorspellingsfouten, Cp, BIC, AIC of aangepaste <sup>R2<\/sup> .<\/span> <span style=\"color: #000000;\">In het onderstaande voorbeeld kiezen we ervoor om AIC te gebruiken.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Het volgende voorbeeld laat zien hoe u een directe selectie uitvoert in R.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Voorbeeld: directe selectie in R<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Voor dit voorbeeld gebruiken we de <a href=\"https:\/\/statorials.org\/nl\/mtcars-r-gegevensset\/\" target=\"_blank\" rel=\"noopener\">mtcars-dataset<\/a> die in R is ingebouwd:<\/span><\/p>\n<pre style=\"background-color: #e5e5e5; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#view first six rows of <em>mtcars\n<\/em><\/span>head(mtcars)\n\n                   mpg cyl disp hp drat wt qsec vs am gear carb\nMazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4\nMazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4\nDatsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1\nHornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1\nHornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2\nValiant 18.1 6 225 105 2.76 3,460 20.22 1 0 3 1\n<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">We passen een meervoudig lineair regressiemodel toe met <em>mpg<\/em> (mijl per gallon) als responsvariabele en de andere tien variabelen in de dataset als potenti\u00eble voorspellende variabelen.<\/span><\/p>\n<p> <span style=\"color: #000000;\">De volgende code laat stap voor stap zien hoe u een selectie uitvoert:<\/span><\/p>\n<pre style=\"background-color: #e5e5e5; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#define intercept-only model\n<\/span>intercept_only &lt;- lm(mpg ~ 1, data=mtcars)\n\n<span style=\"color: #008080;\">#define model with all predictors\n<\/span>all &lt;- lm(mpg ~ ., data=mtcars)\n\n<span style=\"color: #008080;\">#perform forward stepwise regression\n<\/span>forward &lt;- step(intercept_only, direction=' <span style=\"color: #008000;\">forward<\/span> ', scope= <span style=\"color: #3366ff;\">formula<\/span> (all), trace= <span style=\"color: #008000;\">0<\/span> )\n\n<span style=\"color: #008080;\">#view results of forward stepwise regression<\/span>\nforward$anova\n\n   Step Df Deviance Resid. Df Resid. Dev AIC\n1 NA NA 31 1126.0472 115.94345\n2 + wt -1 847.72525 30 278.3219 73.21736\n3 + cyl -1 87.14997 29 191.1720 63.19800\n4 + hp -1 14.55145 28 176.6205 62.66456\n\n<span style=\"color: #008080;\">#view final model\n<\/span>forward$coefficients\n\n(Intercept) wt cyl hp \n 38.7517874 -3.1669731 -0.9416168 -0.0180381 \n<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Zo interpreteert u de resultaten:<\/span><\/p>\n<p> <span style=\"color: #000000;\">Ten eerste passen we het alleen-intercept-model toe. Dit model had een AIC van <strong>115,94345<\/strong> .<\/span><\/p>\n<p> <span style=\"color: #000000;\">Vervolgens passen we alle mogelijke modellen aan een voorspeller aan. Het model dat de laagste AIC produceerde en ook een statistisch significante reductie in AIC had vergeleken met het model dat alleen onderschept, gebruikte de <em>wt-<\/em> voorspeller. Dit model had een AIC van <strong>73,21736<\/strong> .<\/span><\/p>\n<p> <span style=\"color: #000000;\">Vervolgens passen we alle mogelijke modellen aan met twee voorspellers. Het model dat de laagste AIC produceerde en ook een statistisch significante reductie in AIC had vergeleken met het model met \u00e9\u00e9n voorspeller, voegde de <em>cil-<\/em> voorspeller toe. Dit model had een AIC van <strong>63,19800<\/strong> .<\/span><\/p>\n<p> <span style=\"color: #000000;\">Vervolgens passen we alle mogelijke modellen aan drie voorspellers aan. Het model dat de laagste AIC produceerde en ook een statistisch significante reductie in AIC had vergeleken met het model met twee voorspellers, voegde de <em>pk-<\/em> voorspeller toe. Dit model had een AIC van <strong>62,66456<\/strong> .<\/span><\/p>\n<p> <span style=\"color: #000000;\">Vervolgens passen we alle mogelijke modellen aan vier voorspellers aan. Het bleek dat geen van deze modellen een significante vermindering van de AIC opleverde, dus stopten we de procedure.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Het uiteindelijke model blijkt dus:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>mpg = 38,75 \u2013 3,17*gewicht \u2013 0,94*cil \u2013 0,02*hyp<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Het blijkt dat pogingen om meer voorspellende variabelen aan het model toe te voegen niet leiden tot een statistisch significante vermindering van de AIC.<\/span><\/p>\n<p> <span style=\"color: #000000;\">We concluderen dus dat het beste model het model is met drie voorspellende variabelen: wt, cil en hp.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Een opmerking over het gebruik van AIC<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">In het vorige voorbeeld hebben we ervoor gekozen om AIC als metriek te gebruiken om de fit van verschillende regressiemodellen te evalueren.<\/span><\/p>\n<p> <span style=\"color: #000000;\">AIC staat voor <strong>Akaike Information Criterion<\/strong> en wordt als volgt berekend:<\/span><\/p>\n<p> <span style=\"color: #000000;\">AIC = 2K \u2013 2 <em>ln<\/em> (L)<\/span><\/p>\n<p> <span style=\"color: #000000;\">Goud:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\"><strong>K:<\/strong> Het aantal modelparameters.<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong><em>ln<\/em> (L)<\/strong> : De log-waarschijnlijkheid van het model. Dit vertelt ons hoe waarschijnlijk het model is gebaseerd op de gegevens.<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Er zijn echter nog andere meetgegevens die u kunt gebruiken om de pasvorm van regressiemodellen te evalueren, waaronder kruisvalidatie-voorspellingsfouten, Cp, BIC, AIC of aangepaste <sup>R2<\/sup> .<\/span><\/p>\n<p> <span style=\"color: #000000;\">Gelukkig kunt u met de meeste statistische software opgeven welke metriek u wilt gebruiken bij het rechtstreeks selecteren.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Aanvullende bronnen<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">De volgende zelfstudies bieden aanvullende informatie over regressiemodellen:<\/span><\/p>\n<p> <a href=\"https:\/\/statorials.org\/nl\/multicollineariteitsregressie\/\" target=\"_blank\" rel=\"noopener\">Een gids voor multicollineariteit en VIF in regressie<\/a><br \/> <a href=\"https:\/\/statorials.org\/nl\" target=\"_blank\" rel=\"noopener\">Wat wordt als een goede AIC-waarde beschouwd?<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>In de statistiek is stapsgewijze selectie een procedure die we kunnen gebruiken om een regressiemodel te construeren uit een reeks voorspellende variabelen door voorspellers stap voor stap in het model in te voeren en te verwijderen totdat er geen statistisch geldige reden meer is om in te voeren of verwijder er meer. Het doel van [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"class_list":["post-3140","post","type-post","status-publish","format-standard","hentry","category-gids"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Wat is directe selectie? (Definitie en voorbeeld) - Statorialen<\/title>\n<meta name=\"description\" content=\"Deze tutorial geeft uitleg over directe selectie in statistieken, inclusief een definitie en voorbeeld.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/nl\/voorwaartse-selectie\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Wat is directe selectie? (Definitie en voorbeeld) - Statorialen\" \/>\n<meta property=\"og:description\" content=\"Deze tutorial geeft uitleg over directe selectie in statistieken, inclusief een definitie en voorbeeld.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/nl\/voorwaartse-selectie\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-19T00:50:54+00:00\" \/>\n<meta name=\"author\" content=\"Dr.benjamin anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"Dr.benjamin anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"4\u00a0Minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/nl\/voorwaartse-selectie\/\",\"url\":\"https:\/\/statorials.org\/nl\/voorwaartse-selectie\/\",\"name\":\"Wat is directe selectie? (Definitie en voorbeeld) - Statorialen\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/nl\/#website\"},\"datePublished\":\"2023-07-19T00:50:54+00:00\",\"dateModified\":\"2023-07-19T00:50:54+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\"},\"description\":\"Deze tutorial geeft uitleg over directe selectie in statistieken, inclusief een definitie en voorbeeld.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/nl\/voorwaartse-selectie\/#breadcrumb\"},\"inLanguage\":\"de\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/nl\/voorwaartse-selectie\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/nl\/voorwaartse-selectie\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Thuis\",\"item\":\"https:\/\/statorials.org\/nl\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Wat is directe selectie? (definitie &amp; #038; voorbeeld)\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/nl\/#website\",\"url\":\"https:\/\/statorials.org\/nl\/\",\"name\":\"Statorials\",\"description\":\"Uw gids voor statistische competentie\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/nl\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"de\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\",\"name\":\"Dr.benjamin anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/\",\"url\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"caption\":\"Dr.benjamin anderson\"},\"description\":\"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder\",\"sameAs\":[\"http:\/\/statorials.org\/nl\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Wat is directe selectie? (Definitie en voorbeeld) - Statorialen","description":"Deze tutorial geeft uitleg over directe selectie in statistieken, inclusief een definitie en voorbeeld.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/nl\/voorwaartse-selectie\/","og_locale":"de_DE","og_type":"article","og_title":"Wat is directe selectie? (Definitie en voorbeeld) - Statorialen","og_description":"Deze tutorial geeft uitleg over directe selectie in statistieken, inclusief een definitie en voorbeeld.","og_url":"https:\/\/statorials.org\/nl\/voorwaartse-selectie\/","og_site_name":"Statorials","article_published_time":"2023-07-19T00:50:54+00:00","author":"Dr.benjamin anderson","twitter_card":"summary_large_image","twitter_misc":{"Verfasst von":"Dr.benjamin anderson","Gesch\u00e4tzte Lesezeit":"4\u00a0Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/nl\/voorwaartse-selectie\/","url":"https:\/\/statorials.org\/nl\/voorwaartse-selectie\/","name":"Wat is directe selectie? (Definitie en voorbeeld) - Statorialen","isPartOf":{"@id":"https:\/\/statorials.org\/nl\/#website"},"datePublished":"2023-07-19T00:50:54+00:00","dateModified":"2023-07-19T00:50:54+00:00","author":{"@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219"},"description":"Deze tutorial geeft uitleg over directe selectie in statistieken, inclusief een definitie en voorbeeld.","breadcrumb":{"@id":"https:\/\/statorials.org\/nl\/voorwaartse-selectie\/#breadcrumb"},"inLanguage":"de","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/nl\/voorwaartse-selectie\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/nl\/voorwaartse-selectie\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Thuis","item":"https:\/\/statorials.org\/nl\/"},{"@type":"ListItem","position":2,"name":"Wat is directe selectie? (definitie &amp; #038; voorbeeld)"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/nl\/#website","url":"https:\/\/statorials.org\/nl\/","name":"Statorials","description":"Uw gids voor statistische competentie","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/nl\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"de"},{"@type":"Person","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219","name":"Dr.benjamin anderson","image":{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/","url":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","contentUrl":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","caption":"Dr.benjamin anderson"},"description":"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder","sameAs":["http:\/\/statorials.org\/nl"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/3140","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/comments?post=3140"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/3140\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/media?parent=3140"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/categories?post=3140"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/tags?post=3140"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}