{"id":837,"date":"2023-07-28T14:27:08","date_gmt":"2023-07-28T14:27:08","guid":{"rendered":"https:\/\/statorials.org\/nl\/binning-python-met-gelijke-frequentie\/"},"modified":"2023-07-28T14:27:08","modified_gmt":"2023-07-28T14:27:08","slug":"binning-python-met-gelijke-frequentie","status":"publish","type":"post","link":"https:\/\/statorials.org\/nl\/binning-python-met-gelijke-frequentie\/","title":{"rendered":"Binning met gelijke frequentie in python"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\">In de statistiek is <strong>groeperen<\/strong> het proces waarbij numerieke waarden in <em>groepen<\/em> worden geplaatst.<\/span><\/p>\n<p> <span style=\"color: #000000;\">De meest voorkomende vorm van clustering staat bekend als <strong>clustering met gelijke breedte<\/strong> , waarbij we een dataset verdelen in <em>k<\/em> groepen van gelijke breedte.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Een minder vaak gebruikte vorm van clustering staat bekend als <strong>clustering met gelijke frequentie<\/strong> , waarbij we een dataset verdelen in <em>k<\/em> groepen die allemaal een gelijk aantal frequenties hebben.<\/span><\/p>\n<p> <span style=\"color: #000000;\">In deze tutorial wordt uitgelegd hoe u clustering met gelijke frequentie in Python kunt uitvoeren.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Binning met gelijke frequentie in Python<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Stel dat we een dataset hebben met 100 waarden:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #107d3f;\">import<\/span> numpy <span style=\"color: #107d3f;\">as<\/span> np\n<span style=\"color: #107d3f;\">import<\/span> matplotlib.pyplot <span style=\"color: #107d3f;\">as<\/span> plt\n\n<span style=\"color: #008080;\">#create data<\/span>\nnp.random.seed(1)\ndata = np.random.randn(100)\n\n<span style=\"color: #008080;\">#view first 5 values\n<\/span><\/strong><b>data[:5]\n\narray([ 1.62434536, -0.61175641, -0.52817175, -1.07296862, 0.86540763])\n<\/b><\/pre>\n<p> <span style=\"color: #000000;\"><strong>Gelijke breedtegroepering:<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Als we een histogram maken om deze waarden weer te geven, zal Python standaard groeperen met gelijke breedte:<\/span> <\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#create histogram with equal-width bins<\/span>\nn, bins, patches = plt.hist(data, edgecolor='black')\nplt.show()\n\n<span style=\"color: #008080;\">#display bin boundaries and frequency per bin<\/span> \nbins, n\n\n(array([-2.3015387 , -1.85282729, -1.40411588, -0.95540447, -0.50669306,\n        -0.05798165, 0.39072977, 0.83944118, 1.28815259, 1.736864,\n         2.18557541]),\n array([ 3., 1., 6., 17., 19., 20., 14., 12., 5., 3.]))\n<\/strong><\/pre>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-9246 \" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/egalfreqbinningpython1.png\" alt=\"\" width=\"406\" height=\"262\" srcset=\"\" sizes=\"auto, \"><\/p>\n<p> <span style=\"color: #000000;\">Elke groep heeft een gelijke breedte van ongeveer 0,4487, maar elke groep bevat niet een gelijk aantal waarnemingen. Bijvoorbeeld:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">De eerste bak strekt zich uit van -2,3015387 tot -1,8528279 en bevat 3 waarnemingen.<\/span><\/li>\n<li> <span style=\"color: #000000;\">De tweede bak strekt zich uit van -1,8528279 tot -1,40411588 en bevat 1 waarneming.<\/span><\/li>\n<li> <span style=\"color: #000000;\">De derde bak strekt zich uit van -1,40411588 tot -0,95540447 en bevat 6 waarnemingen.<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Enzovoort.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Gelijke frequentiegroepering:<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Om buckets te maken die een gelijk aantal waarnemingen bevatten, kunnen we de volgende functie gebruiken:<\/span> <\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #107d3f;\"><span style=\"color: #008080;\">#define function to calculate equal-frequency bins<\/span> \ndef<\/span> equalObs(x, nbin):\n    nlen = len(x)\n    <span style=\"color: #107d3f;\">return<\/span> np.interp(np.linspace(0, nlen, nbin + 1),\n                     np.arange(nlen),\n                     np.sort(x))\n\n<span style=\"color: #008080;\">#create histogram with equal-frequency bins<\/span> \nn, bins, patches = plt.hist(data, equalObs(data, 10), edgecolor='black')\nplt.show()\n\n<span style=\"color: #008080;\">#display bin boundaries and frequency per bin<\/span> \nbins, n\n\n(array([-2.3015387 , -0.93576943, -0.67124613, -0.37528495, -0.20889423,\n         0.07734007, 0.2344157, 0.51292982, 0.86540763, 1.19891788,\n         2.18557541]),\n array([10., 10., 10., 10., 10., 10., 10., 10., 10., 10.]))<\/strong> <\/pre>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-9247\" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/egalfreqbinningpython2.png\" alt=\"Voorbeeld van gelijke frequentiegroepering in Python\" width=\"395\" height=\"267\" srcset=\"\" sizes=\"auto, \"><\/p>\n<p> <span style=\"color: #000000;\">Elke groep is niet even breed, maar elke groep <i>bevat<\/i> een gelijk aantal waarnemingen. Bijvoorbeeld:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">De eerste bak strekt zich uit van -2,3015387 tot -0,93576943 en bevat 10 waarnemingen.<\/span><\/li>\n<li> <span style=\"color: #000000;\">De tweede bak strekt zich uit van -0,93576943 tot -0,67124613 en bevat 10 waarnemingen.<\/span><\/li>\n<li> <span style=\"color: #000000;\">De derde bak strekt zich uit van -0,67124613 tot -0,37528495 en bevat 10 waarnemingen.<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Enzovoort.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Uit het histogram kunnen we zien dat elke bak duidelijk niet even breed is, maar dat elke bak hetzelfde aantal waarnemingen bevat, wat wordt bevestigd door het feit dat de hoogte van elke bak gelijk is.<\/span><\/p>\n","protected":false},"excerpt":{"rendered":"<p>In de statistiek is groeperen het proces waarbij numerieke waarden in groepen worden geplaatst. De meest voorkomende vorm van clustering staat bekend als clustering met gelijke breedte , waarbij we een dataset verdelen in k groepen van gelijke breedte. Een minder vaak gebruikte vorm van clustering staat bekend als clustering met gelijke frequentie , waarbij [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"class_list":["post-837","post","type-post","status-publish","format-standard","hentry","category-gids"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Binning met gelijke frequentie in Python - Statorials<\/title>\n<meta name=\"description\" content=\"Een eenvoudige uitleg over het uitvoeren van clustering met gelijke frequentie in Python.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/nl\/binning-python-met-gelijke-frequentie\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Binning met gelijke frequentie in Python - Statorials\" \/>\n<meta property=\"og:description\" content=\"Een eenvoudige uitleg over het uitvoeren van clustering met gelijke frequentie in Python.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/nl\/binning-python-met-gelijke-frequentie\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-28T14:27:08+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/egalfreqbinningpython1.png\" \/>\n<meta name=\"author\" content=\"Dr.benjamin anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"Dr.benjamin anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"2\u00a0Minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/nl\/binning-python-met-gelijke-frequentie\/\",\"url\":\"https:\/\/statorials.org\/nl\/binning-python-met-gelijke-frequentie\/\",\"name\":\"Binning met gelijke frequentie in Python - Statorials\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/nl\/#website\"},\"datePublished\":\"2023-07-28T14:27:08+00:00\",\"dateModified\":\"2023-07-28T14:27:08+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\"},\"description\":\"Een eenvoudige uitleg over het uitvoeren van clustering met gelijke frequentie in Python.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/nl\/binning-python-met-gelijke-frequentie\/#breadcrumb\"},\"inLanguage\":\"de\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/nl\/binning-python-met-gelijke-frequentie\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/nl\/binning-python-met-gelijke-frequentie\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Thuis\",\"item\":\"https:\/\/statorials.org\/nl\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Binning met gelijke frequentie in python\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/nl\/#website\",\"url\":\"https:\/\/statorials.org\/nl\/\",\"name\":\"Statorials\",\"description\":\"Uw gids voor statistische competentie\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/nl\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"de\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\",\"name\":\"Dr.benjamin anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/\",\"url\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"caption\":\"Dr.benjamin anderson\"},\"description\":\"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder\",\"sameAs\":[\"http:\/\/statorials.org\/nl\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Binning met gelijke frequentie in Python - Statorials","description":"Een eenvoudige uitleg over het uitvoeren van clustering met gelijke frequentie in Python.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/nl\/binning-python-met-gelijke-frequentie\/","og_locale":"de_DE","og_type":"article","og_title":"Binning met gelijke frequentie in Python - Statorials","og_description":"Een eenvoudige uitleg over het uitvoeren van clustering met gelijke frequentie in Python.","og_url":"https:\/\/statorials.org\/nl\/binning-python-met-gelijke-frequentie\/","og_site_name":"Statorials","article_published_time":"2023-07-28T14:27:08+00:00","og_image":[{"url":"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/egalfreqbinningpython1.png"}],"author":"Dr.benjamin anderson","twitter_card":"summary_large_image","twitter_misc":{"Verfasst von":"Dr.benjamin anderson","Gesch\u00e4tzte Lesezeit":"2\u00a0Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/nl\/binning-python-met-gelijke-frequentie\/","url":"https:\/\/statorials.org\/nl\/binning-python-met-gelijke-frequentie\/","name":"Binning met gelijke frequentie in Python - Statorials","isPartOf":{"@id":"https:\/\/statorials.org\/nl\/#website"},"datePublished":"2023-07-28T14:27:08+00:00","dateModified":"2023-07-28T14:27:08+00:00","author":{"@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219"},"description":"Een eenvoudige uitleg over het uitvoeren van clustering met gelijke frequentie in Python.","breadcrumb":{"@id":"https:\/\/statorials.org\/nl\/binning-python-met-gelijke-frequentie\/#breadcrumb"},"inLanguage":"de","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/nl\/binning-python-met-gelijke-frequentie\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/nl\/binning-python-met-gelijke-frequentie\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Thuis","item":"https:\/\/statorials.org\/nl\/"},{"@type":"ListItem","position":2,"name":"Binning met gelijke frequentie in python"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/nl\/#website","url":"https:\/\/statorials.org\/nl\/","name":"Statorials","description":"Uw gids voor statistische competentie","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/nl\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"de"},{"@type":"Person","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219","name":"Dr.benjamin anderson","image":{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/","url":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","contentUrl":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","caption":"Dr.benjamin anderson"},"description":"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder","sameAs":["http:\/\/statorials.org\/nl"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/837","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/comments?post=837"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/837\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/media?parent=837"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/categories?post=837"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/tags?post=837"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}