{"id":2080,"date":"2023-07-23T19:27:32","date_gmt":"2023-07-23T19:27:32","guid":{"rendered":"https:\/\/statorials.org\/nl\/normaliseer-gegevens-in-python\/"},"modified":"2023-07-23T19:27:32","modified_gmt":"2023-07-23T19:27:32","slug":"normaliseer-gegevens-in-python","status":"publish","type":"post","link":"https:\/\/statorials.org\/nl\/normaliseer-gegevens-in-python\/","title":{"rendered":"Hoe gegevens in python te normaliseren"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\">Vaak <strong>normaliseren<\/strong> we in statistieken en machinaal leren variabelen zodanig dat het bereik van waarden tussen 0 en 1 ligt.<\/span><\/p>\n<p> <span style=\"color: #000000;\">De meest voorkomende reden voor het normaliseren van variabelen is wanneer we een soort multivariate analyse uitvoeren (dwz we willen de relatie tussen verschillende voorspellende variabelen en een responsvariabele begrijpen) en we willen dat elke variabele in gelijke mate aan de analyse bijdraagt.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Wanneer variabelen op verschillende schalen worden gemeten, dragen ze vaak niet in gelijke mate bij aan de analyse. Als de waarden van de ene variabele bijvoorbeeld vari\u00ebren van 0 tot 100.000 en de waarden van een andere variabele van 0 tot 100, krijgt de variabele met het grootste bereik een groter gewicht in de analyse.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Door de variabelen te standaardiseren, kunnen we er zeker van zijn dat elke variabele in gelijke mate bijdraagt aan de analyse.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Om waarden tussen 0 en 1 te normaliseren, kunnen we de volgende formule gebruiken:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>x <sub>norm<\/sub> = (x <sub>i<\/sub> \u2013 x <sub>min<\/sub> ) \/ (x <sub>max<\/sub> \u2013 x <sub>min<\/sub> )<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Goud:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\"><strong>x <sub>norm<\/sub> :<\/strong> de <sup>i-de<\/sup> genormaliseerde waarde in de dataset<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>x <sub>i<\/sub> :<\/strong> de <sup>i-<\/sup> de waarde van de dataset<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>x <sub>max<\/sub><\/strong> : De minimumwaarde in de gegevensset<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>x <sub>min<\/sub> :<\/strong> de maximale waarde in de gegevensset<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">De volgende voorbeelden laten zien hoe u een of meer variabelen in Python kunt normaliseren.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Voorbeeld 1: normaliseer een NumPy-array<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">De volgende code laat zien hoe u alle waarden in een NumPy-array kunt normaliseren:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008000;\">import<\/span> numpy <span style=\"color: #008000;\">as<\/span> np \n\n<span style=\"color: #008080;\">#create NumPy array\n<\/span>data = np. <span style=\"color: #3366ff;\">array<\/span> ([[13, 16, 19, 22, 23, 38, 47, 56, 58, 63, 65, 70, 71]])\n\n<span style=\"color: #008080;\">#normalize all values in array\n<\/span>data_norm = (data - data. <span style=\"color: #3366ff;\">min<\/span> ())\/ (data. <span style=\"color: #3366ff;\">max<\/span> () - data. <span style=\"color: #3366ff;\">min<\/span> ())\n\n<span style=\"color: #008080;\">#view normalized values\n<\/span>data_norm\n\narray([[0. , 0.05172414, 0.10344828, 0.15517241, 0.17241379,\n        0.43103448, 0.5862069, 0.74137931, 0.77586207, 0.86206897,\n        0.89655172, 0.98275862, 1. ]])<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Elk van de waarden in de genormaliseerde array ligt nu tussen 0 en 1.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Voorbeeld 2: Normaliseer alle variabelen in Pandas DataFrame<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">De volgende code laat zien hoe u alle variabelen in een Panda DataFrame kunt normaliseren:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008000;\">import<\/span> pandas <span style=\"color: #008000;\">as<\/span> pd\n\n<span style=\"color: #008080;\">#createDataFrame<\/span>\ndf = pd. <span style=\"color: #3366ff;\">DataFrame<\/span> ({' <span style=\"color: #ff0000;\">points<\/span> ': [25, 12, 15, 14, 19, 23, 25, 29],\n                   ' <span style=\"color: #ff0000;\">assists<\/span> ': [5, 7, 7, 9, 12, 9, 9, 4],\n                   ' <span style=\"color: #ff0000;\">rebounds<\/span> ': [11, 8, 10, 6, 6, 5, 9, 12]})\n\n<span style=\"color: #008080;\">#normalize values in every column\n<\/span>df_norm = (df-df. <span style=\"color: #3366ff;\">min<\/span> ())\/ (df. <span style=\"color: #3366ff;\">max<\/span> () - df. <span style=\"color: #3366ff;\">min<\/span> ())\n\n<span style=\"color: #008080;\">#view normalized DataFrame\n<\/span>df_norm\n\n        points assists rebounds\n0 0.764706 0.125 0.857143\n1 0.000000 0.375 0.428571\n2 0.176471 0.375 0.714286\n3 0.117647 0.625 0.142857\n4 0.411765 1.000 0.142857\n5 0.647059 0.625 0.000000\n6 0.764706 0.625 0.571429\n7 1.000000 0.000 1.000000\n<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Elk van de waarden in elke kolom ligt nu tussen 0 en 1.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Voorbeeld 3: Normaliseer specifieke variabelen in Pandas DataFrame<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">De volgende code laat zien hoe u een specifieke variabele in een Panda DataFrame normaliseert:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008000;\">import<\/span> pandas <span style=\"color: #008000;\">as<\/span> pd\n\n<span style=\"color: #008080;\">#createDataFrame<\/span>\ndf = pd. <span style=\"color: #3366ff;\">DataFrame<\/span> ({' <span style=\"color: #ff0000;\">points<\/span> ': [25, 12, 15, 14, 19, 23, 25, 29],\n                   ' <span style=\"color: #ff0000;\">assists<\/span> ': [5, 7, 7, 9, 12, 9, 9, 4],\n                   ' <span style=\"color: #ff0000;\">rebounds<\/span> ': [11, 8, 10, 6, 6, 5, 9, 12]})\n\n<span style=\"color: #008080;\">define columns to normalize<\/span>\nx = df. <span style=\"color: #3366ff;\">iloc<\/span> [:,0:2]\n\n<span style=\"color: #008080;\">#normalize values in first two columns only<\/span>\ndf. <span style=\"color: #3366ff;\">iloc<\/span> [:,0:2] = (xx. <span style=\"color: #3366ff;\">min<\/span> ())\/ (x. <span style=\"color: #3366ff;\">max<\/span> () - x. <span style=\"color: #3366ff;\">min<\/span> ())\n\n<span style=\"color: #008080;\">#view normalized DataFrame<\/span>\ndf\n\n\tpoints assists rebounds\n0 0.764706 0.125 11\n1 0.000000 0.375 8\n2 0.176471 0.375 10\n3 0.117647 0.625 6\n4 0.411765 1.000 6\n5 0.647059 0.625 5\n6 0.764706 0.625 9\n7 1.000000 0.000 12\n<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Merk op dat alleen de waarden in de eerste twee kolommen zijn genormaliseerd.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Aanvullende bronnen<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">De volgende zelfstudies bieden aanvullende informatie over gegevensnormalisatie:<\/span><\/p>\n<p> <a href=\"https:\/\/statorials.org\/nl\/normaliseer-gegevens-tussen-0-en-1\/\" target=\"_blank\" rel=\"noopener\">Hoe gegevens tussen 0 en 1 te normaliseren<\/a><br \/> <a href=\"https:\/\/statorials.org\/nl\/normaliseer-gegevens-tussen-0-en-100\/\" target=\"_blank\" rel=\"noopener\">Hoe gegevens tussen 0 en 100 te normaliseren<\/a><br \/> <a href=\"https:\/\/statorials.org\/nl\/standaardisatie-versus-normalisatie\/\" target=\"_blank\" rel=\"noopener\">Standaardisatie of normalisatie: wat is het verschil?<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Vaak normaliseren we in statistieken en machinaal leren variabelen zodanig dat het bereik van waarden tussen 0 en 1 ligt. De meest voorkomende reden voor het normaliseren van variabelen is wanneer we een soort multivariate analyse uitvoeren (dwz we willen de relatie tussen verschillende voorspellende variabelen en een responsvariabele begrijpen) en we willen dat elke [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"class_list":["post-2080","post","type-post","status-publish","format-standard","hentry","category-gids"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Gegevens normaliseren in Python - Statorials<\/title>\n<meta name=\"description\" content=\"In deze tutorial wordt uitgelegd hoe u gegevens in Python kunt normaliseren, met verschillende voorbeelden.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/nl\/normaliseer-gegevens-in-python\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Gegevens normaliseren in Python - Statorials\" \/>\n<meta property=\"og:description\" content=\"In deze tutorial wordt uitgelegd hoe u gegevens in Python kunt normaliseren, met verschillende voorbeelden.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/nl\/normaliseer-gegevens-in-python\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-23T19:27:32+00:00\" \/>\n<meta name=\"author\" content=\"Dr.benjamin anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"Dr.benjamin anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"2\u00a0Minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/nl\/normaliseer-gegevens-in-python\/\",\"url\":\"https:\/\/statorials.org\/nl\/normaliseer-gegevens-in-python\/\",\"name\":\"Gegevens normaliseren in Python - Statorials\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/nl\/#website\"},\"datePublished\":\"2023-07-23T19:27:32+00:00\",\"dateModified\":\"2023-07-23T19:27:32+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\"},\"description\":\"In deze tutorial wordt uitgelegd hoe u gegevens in Python kunt normaliseren, met verschillende voorbeelden.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/nl\/normaliseer-gegevens-in-python\/#breadcrumb\"},\"inLanguage\":\"de\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/nl\/normaliseer-gegevens-in-python\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/nl\/normaliseer-gegevens-in-python\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Thuis\",\"item\":\"https:\/\/statorials.org\/nl\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Hoe gegevens in python te normaliseren\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/nl\/#website\",\"url\":\"https:\/\/statorials.org\/nl\/\",\"name\":\"Statorials\",\"description\":\"Uw gids voor statistische competentie\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/nl\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"de\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\",\"name\":\"Dr.benjamin anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/\",\"url\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"caption\":\"Dr.benjamin anderson\"},\"description\":\"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder\",\"sameAs\":[\"http:\/\/statorials.org\/nl\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Gegevens normaliseren in Python - Statorials","description":"In deze tutorial wordt uitgelegd hoe u gegevens in Python kunt normaliseren, met verschillende voorbeelden.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/nl\/normaliseer-gegevens-in-python\/","og_locale":"de_DE","og_type":"article","og_title":"Gegevens normaliseren in Python - Statorials","og_description":"In deze tutorial wordt uitgelegd hoe u gegevens in Python kunt normaliseren, met verschillende voorbeelden.","og_url":"https:\/\/statorials.org\/nl\/normaliseer-gegevens-in-python\/","og_site_name":"Statorials","article_published_time":"2023-07-23T19:27:32+00:00","author":"Dr.benjamin anderson","twitter_card":"summary_large_image","twitter_misc":{"Verfasst von":"Dr.benjamin anderson","Gesch\u00e4tzte Lesezeit":"2\u00a0Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/nl\/normaliseer-gegevens-in-python\/","url":"https:\/\/statorials.org\/nl\/normaliseer-gegevens-in-python\/","name":"Gegevens normaliseren in Python - Statorials","isPartOf":{"@id":"https:\/\/statorials.org\/nl\/#website"},"datePublished":"2023-07-23T19:27:32+00:00","dateModified":"2023-07-23T19:27:32+00:00","author":{"@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219"},"description":"In deze tutorial wordt uitgelegd hoe u gegevens in Python kunt normaliseren, met verschillende voorbeelden.","breadcrumb":{"@id":"https:\/\/statorials.org\/nl\/normaliseer-gegevens-in-python\/#breadcrumb"},"inLanguage":"de","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/nl\/normaliseer-gegevens-in-python\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/nl\/normaliseer-gegevens-in-python\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Thuis","item":"https:\/\/statorials.org\/nl\/"},{"@type":"ListItem","position":2,"name":"Hoe gegevens in python te normaliseren"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/nl\/#website","url":"https:\/\/statorials.org\/nl\/","name":"Statorials","description":"Uw gids voor statistische competentie","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/nl\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"de"},{"@type":"Person","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219","name":"Dr.benjamin anderson","image":{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/","url":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","contentUrl":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","caption":"Dr.benjamin anderson"},"description":"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder","sameAs":["http:\/\/statorials.org\/nl"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/2080","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/comments?post=2080"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/2080\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/media?parent=2080"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/categories?post=2080"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/tags?post=2080"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}