{"id":1219,"date":"2023-07-27T06:07:51","date_gmt":"2023-07-27T06:07:51","guid":{"rendered":"https:\/\/statorials.org\/nl\/classificatie-en-regressiebomen\/"},"modified":"2023-07-27T06:07:51","modified_gmt":"2023-07-27T06:07:51","slug":"classificatie-en-regressiebomen","status":"publish","type":"post","link":"https:\/\/statorials.org\/nl\/classificatie-en-regressiebomen\/","title":{"rendered":"Een inleiding tot classificatie- en regressiebomen"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\">Wanneer de relatie tussen een reeks voorspellende variabelen en een <a href=\"https:\/\/statorials.org\/nl\/variabelen-verklarende-reacties\/\" target=\"_blank\" rel=\"noopener noreferrer\">responsvariabele<\/a> lineair is, kunnen methoden zoals <a href=\"https:\/\/statorials.org\/nl\/meerdere-lineaire-regressie\/\" target=\"_blank\" rel=\"noopener noreferrer\">meervoudige lineaire regressie<\/a> nauwkeurige voorspellende modellen opleveren.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Wanneer de relatie tussen een reeks voorspellers en een respons echter zeer niet-lineair en complex is, kunnen niet-lineaire methoden beter presteren.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Een voorbeeld van een niet-lineaire methode zijn <strong>classificatie- en regressiebomen<\/strong> , vaak afgekort <strong>CART<\/strong> .<\/span><\/p>\n<p> <span style=\"color: #000000;\">Zoals de naam al doet vermoeden, gebruiken CART-modellen een reeks voorspellende variabelen om <em>beslissingsbomen<\/em> te cre\u00ebren die de waarde van een responsvariabele voorspellen.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Stel dat we bijvoorbeeld een dataset hebben met de voorspellende variabelen <em>Gespeelde jaren<\/em> en <em>Gemiddelde homeruns<\/em> en de responsvariabele <em>Jaarsalaris<\/em> voor honderden professionele honkbalspelers.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Zo zou een regressieboom er voor deze dataset uit kunnen zien:<\/span> <\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-12084 \" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/arbre1.png\" alt=\"Voorbeeld van een regressieboom\" width=\"391\" height=\"365\" srcset=\"\" sizes=\"auto, \"><\/p>\n<p> <span style=\"color: #000000;\">De manier om de boom te interpreteren is als volgt:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Spelers die minder dan 4,5 jaar hebben gespeeld, hebben een verwacht salaris van $225,8k.<\/span><\/li>\n<li> <span style=\"color: #000000;\">Spelers die gemiddeld meer dan 4,5 jaar of langer en minder dan 16,5 homeruns hebben gespeeld, hebben een verwacht salaris van $577,6K.<\/span><\/li>\n<li> <span style=\"color: #000000;\">Spelers met 4,5 jaar of meer speelervaring en een gemiddelde van 16,5 homeruns of meer hebben een verwacht salaris van $975,6K.<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">De resultaten van dit model zouden intu\u00eftief logisch moeten zijn: spelers met meer jaren ervaring en meer gemiddelde homeruns verdienen doorgaans hogere salarissen.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Dit model kunnen we vervolgens gebruiken om het salaris van een nieuwe speler te voorspellen.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Laten we bijvoorbeeld zeggen dat een bepaalde speler acht jaar heeft gespeeld en gemiddeld tien homeruns per jaar maakt. Volgens ons model voorspellen we dat deze speler een jaarsalaris heeft van $577,6k.<\/span> <\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-12088 \" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/arbre2.png\" alt=\"BASKETBAL-model\" width=\"421\" height=\"395\" srcset=\"\" sizes=\"auto, \"><\/p>\n<p> <span style=\"color: #000000;\">Enkele opmerkingen over de boom:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">De eerste voorspellende variabele bovenaan de boom is de belangrijkste, dat wil zeggen degene die de meeste invloed heeft op de voorspelling van de waarde van de responsvariabele. In dit geval voorspellen <em>de gespeelde jaren<\/em> het salaris beter dan <em>het gemiddelde van de circuits<\/em> .<\/span><\/li>\n<li> <span style=\"color: #000000;\">De gebieden onderaan de boom worden <em>bladknopen<\/em> genoemd. Deze specifieke boom heeft drie eindknooppunten.<\/span><\/li>\n<\/ul>\n<h3> <span style=\"color: #000000;\"><strong>Stappen om CART-modellen te maken<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">We kunnen de volgende stappen gebruiken om een CART-model voor een bepaalde dataset te maken:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Stap 1: Gebruik recursieve binaire splitsing om een grote boom op basis van de trainingsgegevens te laten groeien.<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Ten eerste gebruiken we een <em>hebzuchtig<\/em> algoritme genaamd recursieve binaire splitsing om een regressieboom te laten groeien met behulp van de volgende methode:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Beschouw alle voorspellende variabelen X <sub>1<\/sub> <sub>,<\/sub> X <sub>2<\/sub> , \u2026 , resterende standaardfout) als de laagste. .<\/span>\n<ul>\n<li> <em><span style=\"color: #000000;\">Voor classificatiebomen kiezen we de voorspeller en het cutpoint zodanig dat de resulterende boom het laagste classificatiefoutenpercentage heeft.<\/span><\/em><\/li>\n<\/ul>\n<\/li>\n<li> <span style=\"color: #000000;\">Herhaal dit proces en stop alleen wanneer elk eindknooppunt minder dan een bepaald minimumaantal waarnemingen heeft.<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Dit algoritme is <em>hebzuchtig<\/em> omdat het bij elke stap van het boombouwproces bepaalt welke splitsing het beste kan worden gemaakt, alleen op basis van die stap, in plaats van naar de toekomst te kijken en een splitsing te kiezen die in een toekomstige fase tot een betere mondiale boom zal leiden.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Stap 2: Pas kostencomplexiteitssnoeien toe op de grote boom om een reeks van de beste bomen te verkrijgen, gebaseerd op \u03b1.<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Zodra we de grote boom hebben laten groeien, moeten we hem <em>snoeien<\/em> met behulp van een methode die bekend staat als complex snoeien en die als volgt werkt:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Zoek voor elke mogelijke boom met T-terminale knooppunten de boom die RSS + \u03b1|T| minimaliseert.<\/span><\/li>\n<li> <span style=\"color: #000000;\">Merk op dat wanneer we de waarde van \u03b1 verhogen, bomen met meer eindknooppunten worden bestraft. Dit zorgt ervoor dat de boom niet te complex wordt.<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Dit proces resulteert in een reeks van de beste bomen voor elke waarde van \u03b1.<\/span><\/p>\n<p> <strong><span style=\"color: #000000;\">Stap 3: Gebruik k-voudige kruisvalidatie om \u03b1 te kiezen<\/span> .<\/strong><\/p>\n<p> <span style=\"color: #000000;\">Zodra we de beste boom voor elke waarde van \u03b1 hebben gevonden, kunnen we <a href=\"https:\/\/statorials.org\/nl\/k-voudige-kruisvalidatie\/\" target=\"_blank\" rel=\"noopener noreferrer\">k-voudige kruisvalidatie<\/a> toepassen om de waarde van \u03b1 te kiezen die de testfout minimaliseert.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Stap 4: Kies de definitieve sjabloon.<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Ten slotte kiezen we het uiteindelijke model dat overeenkomt met de gekozen waarde van \u03b1.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Voor- en nadelen van CART-modellen<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">CART-modellen bieden de volgende <strong>voordelen<\/strong> :<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Ze zijn gemakkelijk te interpreteren.<\/span><\/li>\n<li> <span style=\"color: #000000;\">Ze zijn gemakkelijk uit te leggen.<\/span><\/li>\n<li> <span style=\"color: #000000;\">Ze zijn gemakkelijk te visualiseren.<\/span><\/li>\n<li> <span style=\"color: #000000;\">Ze kunnen worden toegepast op zowel <a href=\"https:\/\/statorials.org\/nl\/regressie-versus-classificatie\/\" target=\"_blank\" rel=\"noopener noreferrer\">regressie- als classificatieproblemen<\/a> .<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">CART-modellen hebben echter de <strong>volgende nadelen:<\/strong><\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Ze hebben doorgaans niet zoveel voorspellende nauwkeurigheid als andere niet-lineaire machine learning-algoritmen. Door veel beslissingsbomen te clusteren met methoden als bagging, boosting en willekeurige forests kan hun voorspellende nauwkeurigheid echter worden verbeterd.<\/span><\/li>\n<\/ul>\n<p> <strong><span style=\"color: #000000;\">Gerelateerd:<\/span><\/strong> <a href=\"https:\/\/statorials.org\/nl\/classificatie-en-regressiebomen-in-r\/\">Hoe classificatie- en regressiebomen in R te passen<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Wanneer de relatie tussen een reeks voorspellende variabelen en een responsvariabele lineair is, kunnen methoden zoals meervoudige lineaire regressie nauwkeurige voorspellende modellen opleveren. Wanneer de relatie tussen een reeks voorspellers en een respons echter zeer niet-lineair en complex is, kunnen niet-lineaire methoden beter presteren. Een voorbeeld van een niet-lineaire methode zijn classificatie- en regressiebomen , [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"class_list":["post-1219","post","type-post","status-publish","format-standard","hentry","category-gids"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Een inleiding tot classificatie- en regressiebomen<\/title>\n<meta name=\"description\" content=\"Deze tutorial biedt een inleiding tot classificatie- en regressiebomen, inclusief verschillende voorbeelden.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/nl\/classificatie-en-regressiebomen\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Een inleiding tot classificatie- en regressiebomen\" \/>\n<meta property=\"og:description\" content=\"Deze tutorial biedt een inleiding tot classificatie- en regressiebomen, inclusief verschillende voorbeelden.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/nl\/classificatie-en-regressiebomen\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-27T06:07:51+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/arbre1.png\" \/>\n<meta name=\"author\" content=\"Dr.benjamin anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"Dr.benjamin anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"4\u00a0Minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/nl\/classificatie-en-regressiebomen\/\",\"url\":\"https:\/\/statorials.org\/nl\/classificatie-en-regressiebomen\/\",\"name\":\"Een inleiding tot classificatie- en regressiebomen\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/nl\/#website\"},\"datePublished\":\"2023-07-27T06:07:51+00:00\",\"dateModified\":\"2023-07-27T06:07:51+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\"},\"description\":\"Deze tutorial biedt een inleiding tot classificatie- en regressiebomen, inclusief verschillende voorbeelden.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/nl\/classificatie-en-regressiebomen\/#breadcrumb\"},\"inLanguage\":\"de\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/nl\/classificatie-en-regressiebomen\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/nl\/classificatie-en-regressiebomen\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Thuis\",\"item\":\"https:\/\/statorials.org\/nl\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Een inleiding tot classificatie- en regressiebomen\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/nl\/#website\",\"url\":\"https:\/\/statorials.org\/nl\/\",\"name\":\"Statorials\",\"description\":\"Uw gids voor statistische competentie\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/nl\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"de\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\",\"name\":\"Dr.benjamin anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/\",\"url\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"caption\":\"Dr.benjamin anderson\"},\"description\":\"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder\",\"sameAs\":[\"http:\/\/statorials.org\/nl\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Een inleiding tot classificatie- en regressiebomen","description":"Deze tutorial biedt een inleiding tot classificatie- en regressiebomen, inclusief verschillende voorbeelden.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/nl\/classificatie-en-regressiebomen\/","og_locale":"de_DE","og_type":"article","og_title":"Een inleiding tot classificatie- en regressiebomen","og_description":"Deze tutorial biedt een inleiding tot classificatie- en regressiebomen, inclusief verschillende voorbeelden.","og_url":"https:\/\/statorials.org\/nl\/classificatie-en-regressiebomen\/","og_site_name":"Statorials","article_published_time":"2023-07-27T06:07:51+00:00","og_image":[{"url":"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/arbre1.png"}],"author":"Dr.benjamin anderson","twitter_card":"summary_large_image","twitter_misc":{"Verfasst von":"Dr.benjamin anderson","Gesch\u00e4tzte Lesezeit":"4\u00a0Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/nl\/classificatie-en-regressiebomen\/","url":"https:\/\/statorials.org\/nl\/classificatie-en-regressiebomen\/","name":"Een inleiding tot classificatie- en regressiebomen","isPartOf":{"@id":"https:\/\/statorials.org\/nl\/#website"},"datePublished":"2023-07-27T06:07:51+00:00","dateModified":"2023-07-27T06:07:51+00:00","author":{"@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219"},"description":"Deze tutorial biedt een inleiding tot classificatie- en regressiebomen, inclusief verschillende voorbeelden.","breadcrumb":{"@id":"https:\/\/statorials.org\/nl\/classificatie-en-regressiebomen\/#breadcrumb"},"inLanguage":"de","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/nl\/classificatie-en-regressiebomen\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/nl\/classificatie-en-regressiebomen\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Thuis","item":"https:\/\/statorials.org\/nl\/"},{"@type":"ListItem","position":2,"name":"Een inleiding tot classificatie- en regressiebomen"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/nl\/#website","url":"https:\/\/statorials.org\/nl\/","name":"Statorials","description":"Uw gids voor statistische competentie","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/nl\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"de"},{"@type":"Person","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219","name":"Dr.benjamin anderson","image":{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/","url":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","contentUrl":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","caption":"Dr.benjamin anderson"},"description":"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder","sameAs":["http:\/\/statorials.org\/nl"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/1219","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/comments?post=1219"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/1219\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/media?parent=1219"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/categories?post=1219"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/tags?post=1219"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}