{"id":835,"date":"2023-07-28T14:27:08","date_gmt":"2023-07-28T14:27:08","guid":{"rendered":"https:\/\/statorials.org\/de\/gleichfrequenz-binning-python\/"},"modified":"2023-07-28T14:27:08","modified_gmt":"2023-07-28T14:27:08","slug":"gleichfrequenz-binning-python","status":"publish","type":"post","link":"https:\/\/statorials.org\/de\/gleichfrequenz-binning-python\/","title":{"rendered":"Equal frequency binning in python"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\">Unter <strong>Gruppierung<\/strong> versteht man in der Statistik den Vorgang der Einordnung numerischer Werte in <em>Gruppen<\/em> .<\/span><\/p>\n<p> <span style=\"color: #000000;\">Die gebr\u00e4uchlichste Form des Clusterings ist das sogenannte <strong>Equal-Width-Clustering<\/strong> , bei dem wir einen Datensatz in <em>k<\/em> Gruppen gleicher Breite unterteilen.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Eine weniger h\u00e4ufig verwendete Form des Clusterings ist das sogenannte <strong>Equal-Frequency-Clustering<\/strong> , bei dem wir einen Datensatz in <em>k<\/em> Gruppen aufteilen, die alle die gleiche Anzahl von H\u00e4ufigkeiten haben.<\/span><\/p>\n<p> <span style=\"color: #000000;\">In diesem Tutorial wird erl\u00e4utert, wie Sie in Python ein Clustering mit gleicher H\u00e4ufigkeit durchf\u00fchren.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Equal Frequency Binning in Python<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Angenommen, wir haben einen Datensatz mit 100 Werten:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #107d3f;\">import<\/span> numpy <span style=\"color: #107d3f;\">as<\/span> np\n<span style=\"color: #107d3f;\">import<\/span> matplotlib.pyplot <span style=\"color: #107d3f;\">as<\/span> plt\n\n<span style=\"color: #008080;\">#create data<\/span>\nnp.random.seed(1)\ndata = np.random.randn(100)\n\n<span style=\"color: #008080;\">#view first 5 values\n<\/span><\/strong><b>data[:5]\n\narray([ 1.62434536, -0.61175641, -0.52817175, -1.07296862, 0.86540763])\n<\/b><\/pre>\n<p> <span style=\"color: #000000;\"><strong>Gruppierung gleicher Breite:<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Wenn wir ein Histogramm erstellen, um diese Werte anzuzeigen, verwendet Python standardm\u00e4\u00dfig die Gruppierung gleicher Breite:<\/span> <\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#create histogram with equal-width bins<\/span>\nn, bins, patches = plt.hist(data, edgecolor='black')\nplt.show()\n\n<span style=\"color: #008080;\">#display bin boundaries and frequency per bin<\/span> \nbins, n\n\n(array([-2.3015387 , -1.85282729, -1.40411588, -0.95540447, -0.50669306,\n        -0.05798165, 0.39072977, 0.83944118, 1.28815259, 1.736864,\n         2.18557541]),\n array([ 3., 1., 6., 17., 19., 20., 14., 12., 5., 3.]))\n<\/strong><\/pre>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-9246 \" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/egalfreqbinningpython1.png\" alt=\"\" width=\"406\" height=\"262\" srcset=\"\" sizes=\"\"><\/p>\n<p> <span style=\"color: #000000;\">Jede Gruppe hat die gleiche Breite von etwa 0,4487, aber jede Gruppe enth\u00e4lt nicht die gleiche Anzahl an Beobachtungen. Zum Beispiel:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Der erste Abschnitt reicht von -2,3015387 bis -1,8528279 und enth\u00e4lt 3 Beobachtungen.<\/span><\/li>\n<li> <span style=\"color: #000000;\">Der zweite Abschnitt erstreckt sich von -1,8528279 bis -1,40411588 und enth\u00e4lt 1 Beobachtung.<\/span><\/li>\n<li> <span style=\"color: #000000;\">Der dritte Bereich reicht von -1,40411588 bis -0,95540447 und enth\u00e4lt 6 Beobachtungen.<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Und so weiter.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Gleiche Frequenzgruppierung:<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Um Buckets zu erstellen, die eine gleiche Anzahl an Beobachtungen enthalten, k\u00f6nnen wir die folgende Funktion verwenden:<\/span> <\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #107d3f;\"><span style=\"color: #008080;\">#define function to calculate equal-frequency bins<\/span> \ndef<\/span> equalObs(x, nbin):\n    nlen = len(x)\n    <span style=\"color: #107d3f;\">return<\/span> np.interp(np.linspace(0, nlen, nbin + 1),\n                     np.arange(nlen),\n                     np.sort(x))\n\n<span style=\"color: #008080;\">#create histogram with equal-frequency bins<\/span> \nn, bins, patches = plt.hist(data, equalObs(data, 10), edgecolor='black')\nplt.show()\n\n<span style=\"color: #008080;\">#display bin boundaries and frequency per bin<\/span> \nbins, n\n\n(array([-2.3015387 , -0.93576943, -0.67124613, -0.37528495, -0.20889423,\n         0.07734007, 0.2344157, 0.51292982, 0.86540763, 1.19891788,\n         2.18557541]),\n array([10., 10., 10., 10., 10., 10., 10., 10., 10., 10.]))<\/strong> <\/pre>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-9247\" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/egalfreqbinningpython2.png\" alt=\"Beispiel f\u00fcr die Gruppierung gleicher H\u00e4ufigkeit in Python\" width=\"395\" height=\"267\" srcset=\"\" sizes=\"\"><\/p>\n<p> <span style=\"color: #000000;\">Jede Gruppe ist nicht gleich breit, aber jede Gruppe <i>enth\u00e4lt<\/i> die gleiche Anzahl an Beobachtungen. Zum Beispiel:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Der erste Abschnitt erstreckt sich von -2,3015387 bis -0,93576943 und enth\u00e4lt 10 Beobachtungen.<\/span><\/li>\n<li> <span style=\"color: #000000;\">Der zweite Bereich reicht von -0,93576943 bis -0,67124613 und enth\u00e4lt 10 Beobachtungen.<\/span><\/li>\n<li> <span style=\"color: #000000;\">Der dritte Bereich reicht von -0,67124613 bis -0,37528495 und enth\u00e4lt 10 Beobachtungen.<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Und so weiter.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Aus dem Histogramm k\u00f6nnen wir ersehen, dass jeder Abschnitt eindeutig nicht die gleiche Breite hat, aber jeder Abschnitt die gleiche Anzahl von Beobachtungen enth\u00e4lt, was durch die Tatsache best\u00e4tigt wird, dass die H\u00f6he jedes Abschnitts gleich ist.<\/span><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Unter Gruppierung versteht man in der Statistik den Vorgang der Einordnung numerischer Werte in Gruppen . Die gebr\u00e4uchlichste Form des Clusterings ist das sogenannte Equal-Width-Clustering , bei dem wir einen Datensatz in k Gruppen gleicher Breite unterteilen. Eine weniger h\u00e4ufig verwendete Form des Clusterings ist das sogenannte Equal-Frequency-Clustering , bei dem wir einen Datensatz in [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Equal Frequency Binning in Python \u2013 Statorials<\/title>\n<meta name=\"description\" content=\"Eine einfache Erkl\u00e4rung, wie man in Python gleichfrequentes Clustering durchf\u00fchrt.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/de\/gleichfrequenz-binning-python\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Equal Frequency Binning in Python \u2013 Statorials\" \/>\n<meta property=\"og:description\" content=\"Eine einfache Erkl\u00e4rung, wie man in Python gleichfrequentes Clustering durchf\u00fchrt.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/de\/gleichfrequenz-binning-python\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-28T14:27:08+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/egalfreqbinningpython1.png\" \/>\n<meta name=\"author\" content=\"Dr. Benjamin Anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"Dr. Benjamin Anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"2 Minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/de\/gleichfrequenz-binning-python\/\",\"url\":\"https:\/\/statorials.org\/de\/gleichfrequenz-binning-python\/\",\"name\":\"Equal Frequency Binning in Python \u2013 Statorials\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/de\/#website\"},\"datePublished\":\"2023-07-28T14:27:08+00:00\",\"dateModified\":\"2023-07-28T14:27:08+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/de\/#\/schema\/person\/ec75c4d6365f2708f8a0ad3a42121aa0\"},\"description\":\"Eine einfache Erkl\u00e4rung, wie man in Python gleichfrequentes Clustering durchf\u00fchrt.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/de\/gleichfrequenz-binning-python\/#breadcrumb\"},\"inLanguage\":\"de-DE\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/de\/gleichfrequenz-binning-python\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/de\/gleichfrequenz-binning-python\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Heim\",\"item\":\"https:\/\/statorials.org\/de\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Equal frequency binning in python\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/de\/#website\",\"url\":\"https:\/\/statorials.org\/de\/\",\"name\":\"Statorials\",\"description\":\"Ihr Leitfaden f\u00fcr statistische Kompetenz !\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/de\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"de-DE\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/de\/#\/schema\/person\/ec75c4d6365f2708f8a0ad3a42121aa0\",\"name\":\"Dr. Benjamin Anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de-DE\",\"@id\":\"https:\/\/statorials.org\/de\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/statorials.org\/de\/wp-content\/uploads\/2023\/11\/Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"https:\/\/statorials.org\/de\/wp-content\/uploads\/2023\/11\/Benjamin-Anderson-96x96.jpg\",\"caption\":\"Dr. Benjamin Anderson\"},\"description\":\"Hallo, ich bin Benjamin, ein pensionierter Statistikprofessor, der sich zum engagierten Statorials-Lehrer entwickelt hat. Mit umfassender Erfahrung und Fachwissen auf dem Gebiet der Statistik bin ich bestrebt, mein Wissen zu teilen, um Studenten durch Statorials zu bef\u00e4higen. Mehr wissen\",\"sameAs\":[\"https:\/\/statorials.org\/de\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Equal Frequency Binning in Python \u2013 Statorials","description":"Eine einfache Erkl\u00e4rung, wie man in Python gleichfrequentes Clustering durchf\u00fchrt.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/de\/gleichfrequenz-binning-python\/","og_locale":"de_DE","og_type":"article","og_title":"Equal Frequency Binning in Python \u2013 Statorials","og_description":"Eine einfache Erkl\u00e4rung, wie man in Python gleichfrequentes Clustering durchf\u00fchrt.","og_url":"https:\/\/statorials.org\/de\/gleichfrequenz-binning-python\/","og_site_name":"Statorials","article_published_time":"2023-07-28T14:27:08+00:00","og_image":[{"url":"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/egalfreqbinningpython1.png"}],"author":"Dr. Benjamin Anderson","twitter_card":"summary_large_image","twitter_misc":{"Verfasst von":"Dr. Benjamin Anderson","Gesch\u00e4tzte Lesezeit":"2 Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/de\/gleichfrequenz-binning-python\/","url":"https:\/\/statorials.org\/de\/gleichfrequenz-binning-python\/","name":"Equal Frequency Binning in Python \u2013 Statorials","isPartOf":{"@id":"https:\/\/statorials.org\/de\/#website"},"datePublished":"2023-07-28T14:27:08+00:00","dateModified":"2023-07-28T14:27:08+00:00","author":{"@id":"https:\/\/statorials.org\/de\/#\/schema\/person\/ec75c4d6365f2708f8a0ad3a42121aa0"},"description":"Eine einfache Erkl\u00e4rung, wie man in Python gleichfrequentes Clustering durchf\u00fchrt.","breadcrumb":{"@id":"https:\/\/statorials.org\/de\/gleichfrequenz-binning-python\/#breadcrumb"},"inLanguage":"de-DE","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/de\/gleichfrequenz-binning-python\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/de\/gleichfrequenz-binning-python\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Heim","item":"https:\/\/statorials.org\/de\/"},{"@type":"ListItem","position":2,"name":"Equal frequency binning in python"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/de\/#website","url":"https:\/\/statorials.org\/de\/","name":"Statorials","description":"Ihr Leitfaden f\u00fcr statistische Kompetenz !","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/de\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"de-DE"},{"@type":"Person","@id":"https:\/\/statorials.org\/de\/#\/schema\/person\/ec75c4d6365f2708f8a0ad3a42121aa0","name":"Dr. Benjamin Anderson","image":{"@type":"ImageObject","inLanguage":"de-DE","@id":"https:\/\/statorials.org\/de\/#\/schema\/person\/image\/","url":"https:\/\/statorials.org\/de\/wp-content\/uploads\/2023\/11\/Benjamin-Anderson-96x96.jpg","contentUrl":"https:\/\/statorials.org\/de\/wp-content\/uploads\/2023\/11\/Benjamin-Anderson-96x96.jpg","caption":"Dr. Benjamin Anderson"},"description":"Hallo, ich bin Benjamin, ein pensionierter Statistikprofessor, der sich zum engagierten Statorials-Lehrer entwickelt hat. Mit umfassender Erfahrung und Fachwissen auf dem Gebiet der Statistik bin ich bestrebt, mein Wissen zu teilen, um Studenten durch Statorials zu bef\u00e4higen. Mehr wissen","sameAs":["https:\/\/statorials.org\/de"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/posts\/835"}],"collection":[{"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/comments?post=835"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/posts\/835\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/media?parent=835"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/categories?post=835"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/tags?post=835"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}