{"id":3446,"date":"2023-07-17T11:04:33","date_gmt":"2023-07-17T11:04:33","guid":{"rendered":"https:\/\/statorials.org\/nl\/labelcodering-versus-een-hot-codering\/"},"modified":"2023-07-17T11:04:33","modified_gmt":"2023-07-17T11:04:33","slug":"labelcodering-versus-een-hot-codering","status":"publish","type":"post","link":"https:\/\/statorials.org\/nl\/labelcodering-versus-een-hot-codering\/","title":{"rendered":"Labelcodering of one-hot-codering: wat is het verschil?"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\">Vaak willen we bij machinaal leren<a href=\"https:\/\/statorials.org\/nl\/categorisch-versus-kwantitatief\/\" target=\"_blank\" rel=\"noopener\">categorische variabelen<\/a> omzetten in een soort numeriek formaat dat gemakkelijk door algoritmen kan worden gebruikt.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Er zijn twee veelgebruikte manieren om categorische variabelen naar numerieke variabelen te converteren:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>1. Labelcodering:<\/strong> wijs aan elke categorische waarde een geheel getal toe op basis van alfabetische volgorde.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>2. E\u00e9n Hot Encoding:<\/strong> maak nieuwe variabelen die de waarden 0 en 1 aannemen om de oorspronkelijke categorische waarden weer te geven.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Stel dat we bijvoorbeeld de volgende gegevensset hebben met twee variabelen en we willen de <strong>Team-<\/strong> variabele converteren van een categorische variabele naar een numerieke variabele:<\/span> <\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\" wp-image-28799 aligncenter\" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/labelencode1.jpg\" alt=\"\" width=\"164\" height=\"292\" srcset=\"\" sizes=\"auto, \"><\/p>\n<p> <span style=\"color: #000000;\">In de volgende voorbeelden ziet u hoe u hiervoor zowel <strong>tagcodering<\/strong> als <strong>one-hot-codering<\/strong> kunt gebruiken.<\/span><\/p>\n<h2> <span style=\"color: #000000;\"><strong>Voorbeeld: Labelcodering gebruiken<\/strong><\/span><\/h2>\n<p> <span style=\"color: #000000;\">Met behulp van <strong>label-codering<\/strong> zouden we elke unieke waarde in de kolom <strong>Team<\/strong> converteren naar een geheel getal op basis van alfabetische volgorde:<\/span> <\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\" wp-image-28801 aligncenter\" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/labelencode2-1.jpg\" alt=\"\" width=\"467\" height=\"288\" srcset=\"\" sizes=\"auto, \"><\/p>\n<p> <span style=\"color: #000000;\">In dit voorbeeld kunnen we zien:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Elke \u201cA\u201d-waarde is omgezet naar <strong>0<\/strong> .<\/span><\/li>\n<li> <span style=\"color: #000000;\">Elke \u201cB\u201d-waarde is omgezet naar <strong>1<\/strong> .<\/span><\/li>\n<li> <span style=\"color: #000000;\">Elke \u201cC\u201d-waarde werd omgezet naar <strong>2<\/strong> .<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">We hebben de kolom <strong>Team<\/strong> met succes geconverteerd van een categorische variabele naar een numerieke variabele.<\/span><\/p>\n<h2> <span style=\"color: #000000;\"><strong>Voorbeeld: gebruik van een enkele one-hot-codering<\/strong><\/span><\/h2>\n<p> <span style=\"color: #000000;\">Met behulp van <strong>one-hot encoding<\/strong> zouden we de <strong>Team-<\/strong> kolom converteren naar<\/span> <span style=\"color: #000000;\">nieuwe variabelen die alleen 0- en 1-waarden bevatten:<\/span> <\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\" wp-image-20468 aligncenter\" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/unhot1.png\" alt=\"\" width=\"592\" height=\"275\" srcset=\"\" sizes=\"auto, \"><\/p>\n<p> <span style=\"color: #000000;\">Wanneer we deze aanpak gebruiken, maken we een nieuwe kolom voor elke unieke waarde in de oorspronkelijke categorische variabele.<\/span><\/p>\n<p> <span style=\"color: #000000;\">De categorische variabele <strong>Team<\/strong> had bijvoorbeeld <strong>drie unieke waarden<\/strong> , dus hebben we <strong>drie nieuwe kolommen<\/strong> in de dataset gemaakt die allemaal waarden 0 of 1 bevatten.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Zo interpreteert u de waarden in de nieuwe kolommen:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">De waarde van de nieuwe kolom <strong>Team_A<\/strong> is 1 als de oorspronkelijke waarde van de kolom <strong>Team<\/strong> A was. Anders is de waarde 0.<\/span><\/li>\n<li> <span style=\"color: #000000;\">De waarde van de nieuwe kolom <strong>Team_B<\/strong> is 1 als de oorspronkelijke waarde van de kolom <strong>Team<\/strong> B was. Anders is de waarde 0.<\/span><\/li>\n<li> <span style=\"color: #000000;\">De waarde van de nieuwe <strong>Team_C-<\/strong> kolom is 1 als de oorspronkelijke waarde van de <strong>Team-<\/strong> kolom C was. Anders is de waarde 0.<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">We hebben de <strong>Team-<\/strong> kolom met succes geconverteerd van \u00e9\u00e9n categorische variabele naar drie numerieke variabelen \u2013 ook wel \u2018dummy\u2019-variabelen genoemd.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Opmerking<\/strong> : wanneer u deze &#8218;dummy&#8216;-variabelen gebruikt in een regressiemodel of ander machine learning-algoritme, zorg er dan voor dat u de <a href=\"https:\/\/statorials.org\/nl\/dummy-variabele-val\/\" target=\"_blank\" rel=\"noopener\">dummy-variabelenval<\/a> vermijdt.<\/span><\/p>\n<h2> <span style=\"color: #000000;\"><strong>Wanneer moet u tagcodering gebruiken versus one-hot-codering?<\/strong><\/span><\/h2>\n<p> <span style=\"color: #000000;\">In de meeste scenario&#8217;s is <strong>one-hot-codering<\/strong> de beste manier om een categorische variabele naar een numerieke variabele te converteren, omdat <strong>bij labelcodering<\/strong> de indruk ontstaat dat er een rangorde tussen de waarden bestaat.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Beschouw bijvoorbeeld het geval waarin we labelcodering gebruikten om team naar een numerieke variabele te converteren:<\/span> <\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\" wp-image-28801 aligncenter\" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/labelencode2-1.jpg\" alt=\"\" width=\"467\" height=\"288\" srcset=\"\" sizes=\"auto, \"><\/p>\n<p> <span style=\"color: #000000;\">Uit de door het label gecodeerde gegevens blijkt dat team C op de een of andere manier groter of groter is dan teams B en A, omdat het een hogere numerieke waarde heeft.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Dit is geen probleem als de oorspronkelijke categorische variabele feitelijk een ordinale variabele is met een natuurlijke ordening of rangschikking, maar in veel scenario&#8217;s is dit niet het geval.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Een van de nadelen van <strong>one-hot-codering<\/strong> is echter dat u net zoveel nieuwe variabelen moet maken als er unieke waarden zijn in de oorspronkelijke categorische variabele.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Dit betekent dat als uw categorische variabele 100 unieke waarden heeft, u 100 nieuwe variabelen moet maken wanneer u one-hot-codering gebruikt.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Afhankelijk van de grootte van uw gegevensset en het type variabelen waarmee u werkt, geeft u mogelijk de voorkeur aan one-hot-codering of label-codering.<\/span><\/p>\n<h2> <span style=\"color: #000000;\"><strong>Aanvullende bronnen<\/strong><\/span><\/h2>\n<p> <span style=\"color: #000000;\">In de volgende tutorials wordt uitgelegd hoe u <strong>labelcodering<\/strong> in de praktijk kunt uitvoeren:<\/span><\/p>\n<ul>\n<li> <a href=\"https:\/\/statorials.org\/nl\/labelcodering-in-r\/\" target=\"_blank\" rel=\"noopener\">Labelcodering uitvoeren in R<\/a><\/li>\n<li> <a href=\"https:\/\/statorials.org\/nl\/labelcodering-in-python\/\" target=\"_blank\" rel=\"noopener\">Labelcodering uitvoeren in Python<\/a><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">In de volgende tutorials wordt uitgelegd hoe u <strong>one-hot-codering<\/strong> in de praktijk kunt uitvoeren:<\/span><\/p>\n<ul>\n<li> <a href=\"https:\/\/statorials.org\/nl\/hete-codering-in-r\/\" target=\"_blank\" rel=\"noopener\">One-Hot-codering uitvoeren in R<\/a><\/li>\n<li> <a href=\"https:\/\/statorials.org\/nl\/hot-codering-in-python\/\" target=\"_blank\" rel=\"noopener\">Hoe One-Hot-codering uit te voeren in Python<\/a><\/li>\n<\/ul>\n","protected":false},"excerpt":{"rendered":"<p>Vaak willen we bij machinaal lerencategorische variabelen omzetten in een soort numeriek formaat dat gemakkelijk door algoritmen kan worden gebruikt. Er zijn twee veelgebruikte manieren om categorische variabelen naar numerieke variabelen te converteren: 1. Labelcodering: wijs aan elke categorische waarde een geheel getal toe op basis van alfabetische volgorde. 2. E\u00e9n Hot Encoding: maak nieuwe [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"class_list":["post-3446","post","type-post","status-publish","format-standard","hentry","category-gids"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Labelcodering of one-hot-codering: wat is het verschil? - Statorialen<\/title>\n<meta name=\"description\" content=\"In deze zelfstudie wordt met voorbeelden het verschil uitgelegd tussen tagcodering en one-hot-codering.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/nl\/labelcodering-versus-een-hot-codering\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Labelcodering of one-hot-codering: wat is het verschil? - Statorialen\" \/>\n<meta property=\"og:description\" content=\"In deze zelfstudie wordt met voorbeelden het verschil uitgelegd tussen tagcodering en one-hot-codering.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/nl\/labelcodering-versus-een-hot-codering\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-17T11:04:33+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/labelencode1.jpg\" \/>\n<meta name=\"author\" content=\"Dr.benjamin anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"Dr.benjamin anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"3\u00a0Minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/nl\/labelcodering-versus-een-hot-codering\/\",\"url\":\"https:\/\/statorials.org\/nl\/labelcodering-versus-een-hot-codering\/\",\"name\":\"Labelcodering of one-hot-codering: wat is het verschil? - Statorialen\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/nl\/#website\"},\"datePublished\":\"2023-07-17T11:04:33+00:00\",\"dateModified\":\"2023-07-17T11:04:33+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\"},\"description\":\"In deze zelfstudie wordt met voorbeelden het verschil uitgelegd tussen tagcodering en one-hot-codering.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/nl\/labelcodering-versus-een-hot-codering\/#breadcrumb\"},\"inLanguage\":\"de\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/nl\/labelcodering-versus-een-hot-codering\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/nl\/labelcodering-versus-een-hot-codering\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Thuis\",\"item\":\"https:\/\/statorials.org\/nl\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Labelcodering of one-hot-codering: wat is het verschil?\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/nl\/#website\",\"url\":\"https:\/\/statorials.org\/nl\/\",\"name\":\"Statorials\",\"description\":\"Uw gids voor statistische competentie\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/nl\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"de\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\",\"name\":\"Dr.benjamin anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/\",\"url\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"caption\":\"Dr.benjamin anderson\"},\"description\":\"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder\",\"sameAs\":[\"http:\/\/statorials.org\/nl\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Labelcodering of one-hot-codering: wat is het verschil? - Statorialen","description":"In deze zelfstudie wordt met voorbeelden het verschil uitgelegd tussen tagcodering en one-hot-codering.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/nl\/labelcodering-versus-een-hot-codering\/","og_locale":"de_DE","og_type":"article","og_title":"Labelcodering of one-hot-codering: wat is het verschil? - Statorialen","og_description":"In deze zelfstudie wordt met voorbeelden het verschil uitgelegd tussen tagcodering en one-hot-codering.","og_url":"https:\/\/statorials.org\/nl\/labelcodering-versus-een-hot-codering\/","og_site_name":"Statorials","article_published_time":"2023-07-17T11:04:33+00:00","og_image":[{"url":"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/labelencode1.jpg"}],"author":"Dr.benjamin anderson","twitter_card":"summary_large_image","twitter_misc":{"Verfasst von":"Dr.benjamin anderson","Gesch\u00e4tzte Lesezeit":"3\u00a0Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/nl\/labelcodering-versus-een-hot-codering\/","url":"https:\/\/statorials.org\/nl\/labelcodering-versus-een-hot-codering\/","name":"Labelcodering of one-hot-codering: wat is het verschil? - Statorialen","isPartOf":{"@id":"https:\/\/statorials.org\/nl\/#website"},"datePublished":"2023-07-17T11:04:33+00:00","dateModified":"2023-07-17T11:04:33+00:00","author":{"@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219"},"description":"In deze zelfstudie wordt met voorbeelden het verschil uitgelegd tussen tagcodering en one-hot-codering.","breadcrumb":{"@id":"https:\/\/statorials.org\/nl\/labelcodering-versus-een-hot-codering\/#breadcrumb"},"inLanguage":"de","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/nl\/labelcodering-versus-een-hot-codering\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/nl\/labelcodering-versus-een-hot-codering\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Thuis","item":"https:\/\/statorials.org\/nl\/"},{"@type":"ListItem","position":2,"name":"Labelcodering of one-hot-codering: wat is het verschil?"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/nl\/#website","url":"https:\/\/statorials.org\/nl\/","name":"Statorials","description":"Uw gids voor statistische competentie","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/nl\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"de"},{"@type":"Person","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219","name":"Dr.benjamin anderson","image":{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/","url":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","contentUrl":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","caption":"Dr.benjamin anderson"},"description":"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder","sameAs":["http:\/\/statorials.org\/nl"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/3446","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/comments?post=3446"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/3446\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/media?parent=3446"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/categories?post=3446"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/tags?post=3446"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}