{"id":1406,"date":"2023-07-26T12:37:50","date_gmt":"2023-07-26T12:37:50","guid":{"rendered":"https:\/\/statorials.org\/nl\/dummyvariabelen-in-r\/"},"modified":"2023-07-26T12:37:50","modified_gmt":"2023-07-26T12:37:50","slug":"dummyvariabelen-in-r","status":"publish","type":"post","link":"https:\/\/statorials.org\/nl\/dummyvariabelen-in-r\/","title":{"rendered":"Dummyvariabelen maken in r (stap voor stap)"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\">Een <a href=\"https:\/\/statorials.org\/nl\/regressie-dummyvariabelen\/\" target=\"_blank\" rel=\"noopener\">dummyvariabele<\/a> is een type variabele die we cre\u00ebren in regressieanalyse, zodat we een categorische variabele kunnen weergeven als een numerieke variabele die een van de twee waarden kan aannemen: nul of \u00e9\u00e9n.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Stel dat we de volgende gegevensset hebben en <em>leeftijd<\/em> en <em>burgerlijke staat<\/em> willen gebruiken om <em>het inkomen<\/em> te voorspellen:<\/span> <\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-13944 \" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/mannequin4.png\" alt=\"\" width=\"246\" height=\"309\" srcset=\"\" sizes=\"auto, \"><\/p>\n<p> <span style=\"color: #000000;\">Om <em>de burgerlijke staat<\/em> als voorspellende variabele in een regressiemodel te gebruiken, moeten we deze omzetten in een dummyvariabele.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Omdat dit momenteel een categorische variabele is die drie verschillende waarden kan aannemen (&#8222;Single&#8220;, &#8222;Married&#8220; of &#8222;Divorced&#8220;), moeten we <em>k<\/em> -1 = 3-1 = 2 dummyvariabelen maken.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Om deze dummyvariabele te maken, kunnen we &#8218;Single&#8216; als basiswaarde laten staan, aangezien deze het vaakst voorkomt. Dus hier is hoe we <em>de burgerlijke staat<\/em> zouden omzetten in dummyvariabelen:<\/span> <\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-13950 \" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/mannequin6.png\" alt=\"\" width=\"615\" height=\"311\" srcset=\"\" sizes=\"auto, \"><\/p>\n<p> <span style=\"color: #000000;\">Deze zelfstudie biedt een stapsgewijs voorbeeld van hoe u dummyvariabelen voor deze exacte gegevensset in R kunt maken en vervolgens regressieanalyse kunt uitvoeren met deze dummyvariabelen als voorspellers.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Stap 1: Cre\u00eber de gegevens<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Laten we eerst de dataset in R maken:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#create data frame<\/span>\ndf &lt;- data. <span style=\"color: #3366ff;\">frame<\/span> (income=c(45000, 48000, 54000, 57000, 65000, 69000,\n                          78000, 83000, 98000, 104000, 107000),\n                 age=c(23, 25, 24, 29, 38, 36, 40, 59, 56, 64, 53),\n                 status=c('Single', 'Single', 'Single', 'Single',\n                          'Married', 'Single', 'Married', 'Divorced',\n                          'Divorced', 'Married', 'Married'))\n\n<span style=\"color: #008080;\">#view data frame\n<\/span>df\n\n   income age status\n1 45000 23 Single\n2 48000 25 Single\n3 54000 24 Single\n4 57000 29 Single\n5 65000 38 Married\n6 69000 36 Single\n7 78000 40 Married\n8 83000 59 Divorced\n9 98000 56 Divorced\n10 104000 64 Married\n11 107000 53 Married<\/strong><\/pre>\n<h3> <span style=\"color: #000000;\"><strong>Stap 2: Maak de dummyvariabelen<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Vervolgens kunnen we de functie <strong>ifelse()<\/strong> in R gebruiken om dummyvariabelen te defini\u00ebren en vervolgens het uiteindelijke dataframe te defini\u00ebren dat we willen gebruiken om het regressiemodel te bouwen:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#create dummy variables<\/span>\nmarried &lt;- <span style=\"color: #3366ff;\">ifelse<\/span> (df$status <span style=\"color: #993300;\">==<\/span> ' <span style=\"color: #008000;\">Married<\/span> ', 1, 0)\ndivorced &lt;- <span style=\"color: #3366ff;\">ifelse<\/span> (df$status <span style=\"color: #993300;\">==<\/span> ' <span style=\"color: #008000;\">Divorced<\/span> ', 1, 0)\n\n<span style=\"color: #008080;\">#create data frame to use for regression\n<\/span>df_reg &lt;- data. <span style=\"color: #3366ff;\">frame<\/span> (income = df$income,\n                     age = df$age,\n                     married = married,\n                     divorced = divorced)\n\n<span style=\"color: #008080;\">#view data frame\n<\/span>df_reg\n\n   income age married divorced\n1 45000 23 0 0\n2 48000 25 0 0\n3 54000 24 0 0\n4 57000 29 0 0\n5 65000 38 1 0\n6 69000 36 0 0\n7 78000 40 1 0\n8 83000 59 0 1\n9 98000 56 0 1\n10 104000 64 1 0\n11 107000 53 1 0\n<\/strong><\/pre>\n<h3> <span style=\"color: #000000;\"><strong>Stap 3: Voer lineaire regressie uit<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Ten slotte kunnen we de functie <strong>lm()<\/strong> gebruiken om een meervoudig lineair regressiemodel te passen:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#create regression model\n<\/span>model &lt;- <span style=\"color: #3366ff;\">lm<\/span> (income ~ age + married + divorced, data=df_reg)\n\n<span style=\"color: #008080;\">#view regression model output\n<\/span>summary(model)\n\nCall:\nlm(formula = income ~ age + married + divorced, data = df_reg)\n\nResiduals:\n    Min 1Q Median 3Q Max \n-9707.5 -5033.8 45.3 3390.4 12245.4 \n\nCoefficients:\n            Estimate Std. Error t value Pr(&gt;|t|)   \n(Intercept) 14276.1 10411.5 1.371 0.21266   \nage 1471.7 354.4 4.152 0.00428 **\nmarried 2479.7 9431.3 0.263 0.80018   \ndivorced -8397.4 12771.4 -0.658 0.53187   \n---\nSignificant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1\n\nResidual standard error: 8391 on 7 degrees of freedom\nMultiple R-squared: 0.9008, Adjusted R-squared: 0.8584 \nF-statistic: 21.2 on 3 and 7 DF, p-value: 0.0006865\n<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">De gepaste regressielijn blijkt te zijn:<\/span><\/p>\n<p> <span style=\"color: #000000;\">Inkomen = 14.276,1 + 1.471,7*(leeftijd) + 2.479,7*(gehuwd) \u2013 8.397,4*(gescheiden)<\/span><\/p>\n<p> <span style=\"color: #000000;\">We kunnen deze vergelijking gebruiken om het geschatte inkomen van een persoon te vinden op basis van zijn leeftijd en burgerlijke staat. Een persoon van 35 jaar en getrouwd zou bijvoorbeeld een geschat inkomen hebben van <strong>$ 68.264<\/strong> :<\/span><\/p>\n<p> <span style=\"color: #000000;\">Inkomen = 14.276,2 + 1.471,7*(35) + 2.479,7*(1) \u2013 8.397,4*(0) = $68.264<\/span><\/p>\n<p> <span style=\"color: #000000;\">Zo interpreteert u de regressieco\u00ebffici\u00ebnten in de tabel:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\"><strong>Intercept:<\/strong> Het intercept vertegenwoordigt het gemiddelde inkomen van een alleenstaande van nul jaar oud. Het is duidelijk dat je geen nuljaren kunt hebben, dus het heeft geen zin om het snijpunt op zichzelf te interpreteren in dit specifieke regressiemodel.<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>Leeftijd:<\/strong> Elk jaar dat de leeftijd stijgt, gaat gepaard met een gemiddelde inkomensstijging van $ 1.471,70. Omdat de p-waarde (0,004) kleiner is dan 0,05, is leeftijd een statistisch significante voorspeller van het inkomen.<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>Getrouwd:<\/strong> Een getrouwde persoon verdient gemiddeld $2.479,70 meer dan een alleenstaande. Omdat de p-waarde (0,800) niet kleiner is dan 0,05, is dit verschil niet statistisch significant.<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>Gescheiden:<\/strong> Een gescheiden persoon verdient gemiddeld \u20ac8.397,40 minder dan een alleenstaande. Omdat de p-waarde (0,532) niet kleiner is dan 0,05, is dit verschil niet statistisch significant.<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Omdat beide dummyvariabelen niet statistisch significant waren, konden we <em>de burgerlijke staat<\/em> als voorspeller uit het model verwijderen, omdat deze geen voorspellende waarde lijkt toe te voegen aan het inkomen.<\/span><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Een dummyvariabele is een type variabele die we cre\u00ebren in regressieanalyse, zodat we een categorische variabele kunnen weergeven als een numerieke variabele die een van de twee waarden kan aannemen: nul of \u00e9\u00e9n. Stel dat we de volgende gegevensset hebben en leeftijd en burgerlijke staat willen gebruiken om het inkomen te voorspellen: Om de burgerlijke [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"class_list":["post-1406","post","type-post","status-publish","format-standard","hentry","category-gids"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Dummyvariabelen maken in R (stap voor stap)<\/title>\n<meta name=\"description\" content=\"In deze tutorial wordt uitgelegd hoe u dummyvariabelen in R maakt, inclusief een stapsgewijs voorbeeld.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/nl\/dummyvariabelen-in-r\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Dummyvariabelen maken in R (stap voor stap)\" \/>\n<meta property=\"og:description\" content=\"In deze tutorial wordt uitgelegd hoe u dummyvariabelen in R maakt, inclusief een stapsgewijs voorbeeld.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/nl\/dummyvariabelen-in-r\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-26T12:37:50+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/mannequin4.png\" \/>\n<meta name=\"author\" content=\"Dr.benjamin anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"Dr.benjamin anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"3\u00a0Minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/nl\/dummyvariabelen-in-r\/\",\"url\":\"https:\/\/statorials.org\/nl\/dummyvariabelen-in-r\/\",\"name\":\"Dummyvariabelen maken in R (stap voor stap)\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/nl\/#website\"},\"datePublished\":\"2023-07-26T12:37:50+00:00\",\"dateModified\":\"2023-07-26T12:37:50+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\"},\"description\":\"In deze tutorial wordt uitgelegd hoe u dummyvariabelen in R maakt, inclusief een stapsgewijs voorbeeld.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/nl\/dummyvariabelen-in-r\/#breadcrumb\"},\"inLanguage\":\"de\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/nl\/dummyvariabelen-in-r\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/nl\/dummyvariabelen-in-r\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Thuis\",\"item\":\"https:\/\/statorials.org\/nl\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Dummyvariabelen maken in r (stap voor stap)\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/nl\/#website\",\"url\":\"https:\/\/statorials.org\/nl\/\",\"name\":\"Statorials\",\"description\":\"Uw gids voor statistische competentie\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/nl\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"de\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\",\"name\":\"Dr.benjamin anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/\",\"url\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"caption\":\"Dr.benjamin anderson\"},\"description\":\"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder\",\"sameAs\":[\"http:\/\/statorials.org\/nl\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Dummyvariabelen maken in R (stap voor stap)","description":"In deze tutorial wordt uitgelegd hoe u dummyvariabelen in R maakt, inclusief een stapsgewijs voorbeeld.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/nl\/dummyvariabelen-in-r\/","og_locale":"de_DE","og_type":"article","og_title":"Dummyvariabelen maken in R (stap voor stap)","og_description":"In deze tutorial wordt uitgelegd hoe u dummyvariabelen in R maakt, inclusief een stapsgewijs voorbeeld.","og_url":"https:\/\/statorials.org\/nl\/dummyvariabelen-in-r\/","og_site_name":"Statorials","article_published_time":"2023-07-26T12:37:50+00:00","og_image":[{"url":"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/mannequin4.png"}],"author":"Dr.benjamin anderson","twitter_card":"summary_large_image","twitter_misc":{"Verfasst von":"Dr.benjamin anderson","Gesch\u00e4tzte Lesezeit":"3\u00a0Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/nl\/dummyvariabelen-in-r\/","url":"https:\/\/statorials.org\/nl\/dummyvariabelen-in-r\/","name":"Dummyvariabelen maken in R (stap voor stap)","isPartOf":{"@id":"https:\/\/statorials.org\/nl\/#website"},"datePublished":"2023-07-26T12:37:50+00:00","dateModified":"2023-07-26T12:37:50+00:00","author":{"@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219"},"description":"In deze tutorial wordt uitgelegd hoe u dummyvariabelen in R maakt, inclusief een stapsgewijs voorbeeld.","breadcrumb":{"@id":"https:\/\/statorials.org\/nl\/dummyvariabelen-in-r\/#breadcrumb"},"inLanguage":"de","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/nl\/dummyvariabelen-in-r\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/nl\/dummyvariabelen-in-r\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Thuis","item":"https:\/\/statorials.org\/nl\/"},{"@type":"ListItem","position":2,"name":"Dummyvariabelen maken in r (stap voor stap)"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/nl\/#website","url":"https:\/\/statorials.org\/nl\/","name":"Statorials","description":"Uw gids voor statistische competentie","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/nl\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"de"},{"@type":"Person","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219","name":"Dr.benjamin anderson","image":{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/","url":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","contentUrl":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","caption":"Dr.benjamin anderson"},"description":"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder","sameAs":["http:\/\/statorials.org\/nl"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/1406","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/comments?post=1406"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/1406\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/media?parent=1406"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/categories?post=1406"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/tags?post=1406"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}