{"id":1117,"date":"2023-07-27T14:52:53","date_gmt":"2023-07-27T14:52:53","guid":{"rendered":"https:\/\/statorials.org\/nl\/normaliseer-gegevens-in-r\/"},"modified":"2023-07-27T14:52:53","modified_gmt":"2023-07-27T14:52:53","slug":"normaliseer-gegevens-in-r","status":"publish","type":"post","link":"https:\/\/statorials.org\/nl\/normaliseer-gegevens-in-r\/","title":{"rendered":"Gegevens standaardiseren in r: met voorbeelden"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\"><strong>Het standaardiseren van<\/strong> een dataset betekent het schalen van alle waarden in de dataset zodat de gemiddelde waarde 0 is en de standaardafwijking 1.<\/span><\/p>\n<p> <span style=\"color: #000000;\">De meest gebruikelijke manier om dit te doen is door gebruik te maken van z-score-standaardisatie, waarbij de waarden worden geschaald met behulp van de volgende formule:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>(x <sub>ik<\/sub> \u2013 <span style=\"text-decoration: overline;\">x<\/span> ) \/ s<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Goud:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\"><strong>x <sub>i<\/sub><\/strong> : de <sup>i-<\/sup> de waarde van de dataset<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong><span style=\"text-decoration: overline;\">x<\/span><\/strong> : De steekproefgemiddelden<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>s<\/strong> : de standaarddeviatie van het monster<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">De volgende voorbeelden laten zien hoe u de functie <a href=\"https:\/\/statorials.org\/nl\/schaalfunctie-in-r\/\" target=\"_blank\" rel=\"noopener\">scale()<\/a> kunt gebruiken met het <strong>dplyr-<\/strong> pakket in R om een of meer variabelen in een dataframe te schalen met behulp van z-score-standaardisatie.<\/span><\/p>\n<h2> <span style=\"color: #000000;\"><strong>Standaardiseer een enkele variabele<\/strong><\/span><\/h2>\n<p> <span style=\"color: #000000;\">De volgende code laat zien hoe u een enkele variabele in een dataframe met drie variabelen kunt schalen:<br \/><\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #993300;\">library<\/span> (dplyr)\n\n<span style=\"color: #008080;\">#make this example reproducible<\/span> \nset.seed(1)\n\n<span style=\"color: #008080;\">#create original data frame\n<\/span>df &lt;- data.frame(var1= runif(10, 0, 50), \n                 var2= runif(10, 2, 23),\n                 var3= runif(10, 5, 38))\n<span style=\"color: #008080;\">\n#view original data frame<\/span>\ndf\n\n        var1 var2 var3\n1 13.275433 6.325466 35.845273\n2 18.606195 5.707692 12.000703\n3 28.642668 16.427480 26.505234\n4 45.410389 10.066178 9.143318\n5 10.084097 18.166670 13.818282\n6 44.919484 12.451684 17.741765\n7 47.233763 17.069989 5.441881\n8 33.039890 22.830028 17.618803\n9 31.455702 9.980739 33.699798\n10 3.089314 18.326350 16.231517\n\n<span style=\"color: #008080;\">#scale <em>var1<\/em> to have mean = 0 and standard deviation = 1<\/span>\ndf2 &lt;- df %&gt;% <span style=\"color: #3366ff;\">mutate_at<\/span> (c(' <span style=\"color: #008000;\">var1<\/span> '), ~( <span style=\"color: #3366ff;\">scale<\/span> (.) %&gt;% <span style=\"color: #3366ff;\">as.vector<\/span> ))\ndf2\n\n          var1 var2 var3\n1 -0.90606801 6.325466 35.845273\n2 -0.56830963 5.707692 12.000703\n3 0.06760377 16.427480 26.505234\n4 1.13001072 10.066178 9.143318\n5 -1.10827188 18.166670 13.818282\n6 1.09890684 12.451684 17.741765\n7 1.24554014 17.069989 5.441881\n8 0.34621281 22.830028 17.618803\n9 0.24583830 9.980739 33.699798\n10 -1.55146305 18.326350 16.231517\n<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Merk op dat alleen de eerste variabele werd geschaald, terwijl de andere twee variabelen hetzelfde bleven. We kunnen snel bevestigen dat de nieuwe geschaalde variabele een gemiddelde waarde van 0 en een standaarddeviatie van 1 heeft:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#calculate mean of scaled variable<\/span>\nmean(df2$var1)\n\n[1] -4.18502e-18 <span style=\"color: #008080;\">#basically zero<\/span>\n\n<span style=\"color: #008080;\">#calculate standard deviation of scaled variable<\/span> \nsd(df2$var1)\n\n[1] 1<\/strong><\/pre>\n<h2> <span style=\"color: #000000;\"><strong>Standaardiseer meerdere variabelen<\/strong><\/span><\/h2>\n<p> <span style=\"color: #000000;\">De volgende code laat zien hoe u meerdere variabelen in een dataframe tegelijk kunt schalen:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #993300;\">library<\/span> (dplyr)\n\n<span style=\"color: #008080;\">#make this example reproducible<\/span> \nset.seed(1)\n\n<span style=\"color: #008080;\">#create original data frame\n<\/span>df &lt;- data.frame(var1= runif(10, 0, 50), \n                 var2= runif(10, 2, 23),\n                 var3= runif(10, 5, 38))\n\n<span style=\"color: #008080;\">#scale <em>var1<\/em> and <em>var2<\/em> to have mean = 0 and standard deviation = 1<\/span>\ndf3 &lt;- df %&gt;% <span style=\"color: #3366ff;\">mutate_at<\/span> (c(' <span style=\"color: #008000;\">var1<\/span> ', ' <span style=\"color: #008000;\">var2<\/span> '), ~( <span style=\"color: #3366ff;\">scale<\/span> (.) %&gt;% <span style=\"color: #3366ff;\">as.vector<\/span> ))\ndf3\n\n          var1 var2 var3\n1 -0.90606801 -1.3045574 35.845273\n2 -0.56830963 -1.4133223 12.000703\n3 0.06760377 0.4739961 26.505234\n4 1.13001072 -0.6459703 9.143318\n5 -1.10827188 0.7801967 13.818282\n6 1.09890684 -0.2259798 17.741765\n7 1.24554014 0.5871157 5.441881\n8 0.34621281 1.6012242 17.618803\n9 0.24583830 -0.6610127 33.699798\n10 -1.55146305 0.8083098 16.231517<\/strong><\/pre>\n<h2> <span style=\"color: #000000;\"><strong>Standaardiseer alle variabelen<\/strong><\/span><\/h2>\n<p> <span style=\"color: #000000;\">De volgende code laat zien hoe u <em>alle<\/em> variabelen in een dataframe kunt schalen met behulp van de functie <strong>mute_all<\/strong> :<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #993300;\">library<\/span> (dplyr)\n\n<span style=\"color: #008080;\">#make this example reproducible<\/span> \nset.seed(1)\n\n<span style=\"color: #008080;\">#create original data frame\n<\/span>df &lt;- data.frame(var1= runif(10, 0, 50), \n                 var2= runif(10, 2, 23),\n                 var3= runif(10, 5, 38))\n\n<span style=\"color: #008080;\">#scale all variables to have mean = 0 and standard deviation = 1<\/span>\ndf4 &lt;- df %&gt;% <span style=\"color: #3366ff;\">mutate_all<\/span> (~( <span style=\"color: #3366ff;\">scale<\/span> (.) %&gt;% <span style=\"color: #3366ff;\">as.vector<\/span> ))\ndf4\n\n          var1 var2 var3\n1 -0.90606801 -1.3045574 1.6819976\n2 -0.56830963 -1.4133223 -0.6715858\n3 0.06760377 0.4739961 0.7600871\n4 1.13001072 -0.6459703 -0.9536246\n5 -1.10827188 0.7801967 -0.4921813\n6 1.09890684 -0.2259798 -0.1049130\n7 1.24554014 0.5871157 -1.3189757\n8 0.34621281 1.6012242 -0.1170501\n9 0.24583830 -0.6610127 1.4702281\n10 -1.55146305 0.8083098 -0.2539824<\/strong><\/pre>\n<h2> <span style=\"color: #000000;\"><strong>Aanvullende bronnen<\/strong><\/span><\/h2>\n<p> <span style=\"color: #000000;\">In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in R kunt uitvoeren:<\/span><\/p>\n<p> <a href=\"https:\/\/statorials.org\/nl\/hoe-gegevens-in-r-te-normaliseren\/\" target=\"_blank\" rel=\"noopener noreferrer\">Hoe gegevens in R te normaliseren<\/a><br \/> <a href=\"https:\/\/statorials.org\/nl\/standaarddeviatie-in-r\/\" target=\"_blank\" rel=\"noopener noreferrer\">Hoe de standaarddeviatie in R te berekenen<\/a><br \/> <a href=\"https:\/\/statorials.org\/nl\/impliceer-ontbrekende-waarden-in-r\/\" target=\"_blank\" rel=\"noopener noreferrer\">Hoe je allemaal ontbrekende waarden in R kunt toeschrijven<\/a><br \/> <a href=\"https:\/\/statorials.org\/nl\/transformeer-gegevens-in-r\/\" target=\"_blank\" rel=\"noopener noreferrer\">Gegevens transformeren in R (logboek, vierkantswortel, kubuswortel)<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Het standaardiseren van een dataset betekent het schalen van alle waarden in de dataset zodat de gemiddelde waarde 0 is en de standaardafwijking 1. De meest gebruikelijke manier om dit te doen is door gebruik te maken van z-score-standaardisatie, waarbij de waarden worden geschaald met behulp van de volgende formule: (x ik \u2013 x ) [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"class_list":["post-1117","post","type-post","status-publish","format-standard","hentry","category-gids"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Gegevens standaardiseren in R (met voorbeelden) - Statorials<\/title>\n<meta name=\"description\" content=\"In deze tutorial wordt uitgelegd hoe u gegevens in R kunt standaardiseren, met verschillende voorbeelden.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/nl\/normaliseer-gegevens-in-r\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Gegevens standaardiseren in R (met voorbeelden) - Statorials\" \/>\n<meta property=\"og:description\" content=\"In deze tutorial wordt uitgelegd hoe u gegevens in R kunt standaardiseren, met verschillende voorbeelden.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/nl\/normaliseer-gegevens-in-r\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-27T14:52:53+00:00\" \/>\n<meta name=\"author\" content=\"Dr.benjamin anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"Dr.benjamin anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"2\u00a0Minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/nl\/normaliseer-gegevens-in-r\/\",\"url\":\"https:\/\/statorials.org\/nl\/normaliseer-gegevens-in-r\/\",\"name\":\"Gegevens standaardiseren in R (met voorbeelden) - Statorials\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/nl\/#website\"},\"datePublished\":\"2023-07-27T14:52:53+00:00\",\"dateModified\":\"2023-07-27T14:52:53+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\"},\"description\":\"In deze tutorial wordt uitgelegd hoe u gegevens in R kunt standaardiseren, met verschillende voorbeelden.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/nl\/normaliseer-gegevens-in-r\/#breadcrumb\"},\"inLanguage\":\"de\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/nl\/normaliseer-gegevens-in-r\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/nl\/normaliseer-gegevens-in-r\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Thuis\",\"item\":\"https:\/\/statorials.org\/nl\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Gegevens standaardiseren in r: met voorbeelden\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/nl\/#website\",\"url\":\"https:\/\/statorials.org\/nl\/\",\"name\":\"Statorials\",\"description\":\"Uw gids voor statistische competentie\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/nl\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"de\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\",\"name\":\"Dr.benjamin anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/\",\"url\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"caption\":\"Dr.benjamin anderson\"},\"description\":\"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder\",\"sameAs\":[\"http:\/\/statorials.org\/nl\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Gegevens standaardiseren in R (met voorbeelden) - Statorials","description":"In deze tutorial wordt uitgelegd hoe u gegevens in R kunt standaardiseren, met verschillende voorbeelden.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/nl\/normaliseer-gegevens-in-r\/","og_locale":"de_DE","og_type":"article","og_title":"Gegevens standaardiseren in R (met voorbeelden) - Statorials","og_description":"In deze tutorial wordt uitgelegd hoe u gegevens in R kunt standaardiseren, met verschillende voorbeelden.","og_url":"https:\/\/statorials.org\/nl\/normaliseer-gegevens-in-r\/","og_site_name":"Statorials","article_published_time":"2023-07-27T14:52:53+00:00","author":"Dr.benjamin anderson","twitter_card":"summary_large_image","twitter_misc":{"Verfasst von":"Dr.benjamin anderson","Gesch\u00e4tzte Lesezeit":"2\u00a0Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/nl\/normaliseer-gegevens-in-r\/","url":"https:\/\/statorials.org\/nl\/normaliseer-gegevens-in-r\/","name":"Gegevens standaardiseren in R (met voorbeelden) - Statorials","isPartOf":{"@id":"https:\/\/statorials.org\/nl\/#website"},"datePublished":"2023-07-27T14:52:53+00:00","dateModified":"2023-07-27T14:52:53+00:00","author":{"@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219"},"description":"In deze tutorial wordt uitgelegd hoe u gegevens in R kunt standaardiseren, met verschillende voorbeelden.","breadcrumb":{"@id":"https:\/\/statorials.org\/nl\/normaliseer-gegevens-in-r\/#breadcrumb"},"inLanguage":"de","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/nl\/normaliseer-gegevens-in-r\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/nl\/normaliseer-gegevens-in-r\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Thuis","item":"https:\/\/statorials.org\/nl\/"},{"@type":"ListItem","position":2,"name":"Gegevens standaardiseren in r: met voorbeelden"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/nl\/#website","url":"https:\/\/statorials.org\/nl\/","name":"Statorials","description":"Uw gids voor statistische competentie","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/nl\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"de"},{"@type":"Person","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219","name":"Dr.benjamin anderson","image":{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/","url":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","contentUrl":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","caption":"Dr.benjamin anderson"},"description":"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder","sameAs":["http:\/\/statorials.org\/nl"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/1117","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/comments?post=1117"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/1117\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/media?parent=1117"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/categories?post=1117"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/tags?post=1117"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}