{"id":4234,"date":"2023-07-12T15:37:29","date_gmt":"2023-07-12T15:37:29","guid":{"rendered":"https:\/\/statorials.org\/de\/pandas-groupby-resample\/"},"modified":"2023-07-12T15:37:29","modified_gmt":"2023-07-12T15:37:29","slug":"pandas-groupby-resample","status":"publish","type":"post","link":"https:\/\/statorials.org\/de\/pandas-groupby-resample\/","title":{"rendered":"Pandas: wie man zeitreihen mit groupby() neu abtastet"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\"><strong>Beim Resampling<\/strong> von Zeitreihendaten werden die Daten \u00fcber einen neuen Zeitraum aggregiert.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Wenn Sie eine Zeitreihe in Pandas mithilfe des <strong>Groupby-<\/strong> Operators erneut abtasten m\u00f6chten, k\u00f6nnen Sie die folgende grundlegende Syntax verwenden:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong>group = df. <span style=\"color: #3366ff;\">groupby<\/span> ([pd. <span style=\"color: #3366ff;\">Group<\/span> (freq=' <span style=\"color: #ff0000;\">W<\/span> '), ' <span style=\"color: #ff0000;\">store<\/span> '])\n\nresult = group[' <span style=\"color: #ff0000;\">sales<\/span> ']. <span style=\"color: #3366ff;\">sum<\/span> (). <span style=\"color: #3366ff;\">unstack<\/span> (' <span style=\"color: #ff0000;\">store<\/span> '). <span style=\"color: #3366ff;\">fillna<\/span> (0) \n<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">In diesem speziellen Beispiel werden die Zeilen des DataFrame nach der <strong>Store-<\/strong> Spalte gruppiert, dann wird die Zeitreihe nach Woche erneut abgetastet ( <strong>freq=&#8217;W&#8216;<\/strong> ) und dann wird die Summe der Werte in der <strong>Verkaufsspalte<\/strong> berechnet.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Beachten Sie, dass wir Zeitreihendaten auf verschiedene Zeitr\u00e4ume \u00fcbertragen k\u00f6nnen, darunter:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\"><strong>S<\/strong> : Sekunden<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>min<\/strong> : Minuten<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>H<\/strong> : Stunden<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>J<\/strong> : Tag<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>W<\/strong> : Woche<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>M<\/strong> : Monat<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>F<\/strong> : Viertel<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>A<\/strong> : Jahr<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Das folgende Beispiel zeigt, wie Zeitreihendaten mit einer <strong>Groupby-<\/strong> Operation in der Praxis erneut abgetastet werden.<\/span><\/p>\n<h2> <span style=\"color: #000000;\"><strong>Beispiel: Erneutes Abtasten einer Zeitreihe mit Groupby in Pandas<\/strong><\/span><\/h2>\n<p> <span style=\"color: #000000;\">Angenommen, wir haben den folgenden Pandas-DataFrame, der die t\u00e4glichen Gesamtverk\u00e4ufe in zwei verschiedenen Gesch\u00e4ften anzeigt:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008000;\">import<\/span> pandas <span style=\"color: #008000;\">as<\/span> pd\n\n<span style=\"color: #008080;\">#createDataFrame\n<\/span>df = pd. <span style=\"color: #3366ff;\">DataFrame<\/span> ({' <span style=\"color: #ff0000;\">sales<\/span> ': [13, 14, 17, 17, 16, 22, 28, 10, 17, 10, 11],\n                   ' <span style=\"color: #ff0000;\">store<\/span> ': ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B', 'B']} ,\n                   index=pd. <span style=\"color: #3366ff;\">date_range<\/span> ('2023-01-06', '2023-01-16', freq='d'))\n\n<span style=\"color: #008080;\">#view DataFrame\n<\/span><span style=\"color: #008000;\">print<\/span> (df)\n\n            sales store\n2023-01-06 13 A\n2023-01-07 14 A\n2023-01-08 17 A\n2023-01-09 17 A\n2023-01-10 16A\n2023-01-11 22 B\n2023-01-12 28 B\n2023-01-13 10 B\n2023-01-14 17 B\n2023-01-15 10 B\n2023-01-16 11 B<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Nehmen wir an, wir m\u00f6chten die Zeilen nach <strong>Filiale<\/strong> gruppieren, dann die Zeitreihe nach Woche erneut abtasten und dann die Summe der Werte in der <strong>Verkaufsspalte<\/strong> berechnen.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Wir k\u00f6nnen dazu die folgende Syntax verwenden:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#group by store and resample time series by week<\/span>\ngroup = df. <span style=\"color: #3366ff;\">groupby<\/span> ([pd. <span style=\"color: #3366ff;\">Group<\/span> (freq=' <span style=\"color: #ff0000;\">W<\/span> '), ' <span style=\"color: #ff0000;\">store<\/span> '])\n\n<span style=\"color: #008080;\">#calculate sum of sales each week by store\n<\/span>result = group[' <span style=\"color: #ff0000;\">sales<\/span> ']. <span style=\"color: #3366ff;\">sum<\/span> (). <span style=\"color: #3366ff;\">unstack<\/span> (' <span style=\"color: #ff0000;\">store<\/span> '). <span style=\"color: #3366ff;\">fillna<\/span> (0)\n\n<span style=\"color: #008080;\">#view results<\/span>\n<span style=\"color: #008000;\">print<\/span> (result)\n\nstore AB\n2023-01-08 14.0 0.0\n2023-01-15 16.5 17.0\n2023-01-22 0.0 11.0\n<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Aus dem Ergebnis k\u00f6nnen wir sehen:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Die Summe der Verk\u00e4ufe f\u00fcr die Woche bis zum 01.08.2023 in Gesch\u00e4ft A betr\u00e4gt <strong>14<\/strong> .<\/span><\/li>\n<li> <span style=\"color: #000000;\">Die Summe der Verk\u00e4ufe f\u00fcr die Woche bis zum 01.08.2023 in Filiale B betr\u00e4gt <strong>0<\/strong> .<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Und so weiter.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Beachten Sie, dass wir uns in diesem Beispiel daf\u00fcr entschieden haben, die Summe der Werte in der <strong>Verkaufsspalte<\/strong> zu berechnen.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Wir k\u00f6nnten jedoch auch andere Metriken wie Anzahl, Durchschnitt, Median, Minimum, Maximum usw. w\u00e4hlen.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Ersetzen Sie einfach <strong>sum()<\/strong> im obigen Code durch <strong>count()<\/strong> , <strong>Mean()<\/strong> , <strong>Median()<\/strong> usw. um die Metrik Ihrer Wahl zu berechnen.<\/span><\/p>\n<h2> <span style=\"color: #000000;\"><strong>Zus\u00e4tzliche Ressourcen<\/strong><\/span><\/h2>\n<p> <span style=\"color: #000000;\">In den folgenden Tutorials wird erl\u00e4utert, wie Sie andere g\u00e4ngige Vorg\u00e4nge in Python ausf\u00fchren:<\/span><\/p>\n<p> <a href=\"https:\/\/statorials.org\/de\/matplotlib-zeitreihe\/\" target=\"_blank\" rel=\"noopener\">So zeichnen Sie eine Zeitreihe in Matplotlib<\/a><br \/> <a href=\"https:\/\/statorials.org\/de\/seaborn-zeitleiste\/\" target=\"_blank\" rel=\"noopener\">So zeichnen Sie eine Zeitreihe in Seaborn auf<\/a><br \/> <a href=\"https:\/\/statorials.org\/de\/python-karte\/\" target=\"_blank\" rel=\"noopener\">So berechnen Sie MAPE aus Zeitreihen in Python<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Beim Resampling von Zeitreihendaten werden die Daten \u00fcber einen neuen Zeitraum aggregiert. Wenn Sie eine Zeitreihe in Pandas mithilfe des Groupby- Operators erneut abtasten m\u00f6chten, k\u00f6nnen Sie die folgende grundlegende Syntax verwenden: group = df. groupby ([pd. Group (freq=&#8216; W &#8218;), &#8218; store &#8218;]) result = group[&#8218; sales &#8218;]. sum (). unstack (&#8218; store &#8218;). [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Pandas: So resampeln Sie Zeitreihen mit groupby() \u2013 Statorials<\/title>\n<meta name=\"description\" content=\"In diesem Tutorial wird erl\u00e4utert, wie eine Zeitreihe in Pandas unter Verwendung der Groupby-Operation erneut abgetastet wird, einschlie\u00dflich eines Beispiels.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/de\/pandas-groupby-resample\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Pandas: So resampeln Sie Zeitreihen mit groupby() \u2013 Statorials\" \/>\n<meta property=\"og:description\" content=\"In diesem Tutorial wird erl\u00e4utert, wie eine Zeitreihe in Pandas unter Verwendung der Groupby-Operation erneut abgetastet wird, einschlie\u00dflich eines Beispiels.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/de\/pandas-groupby-resample\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-12T15:37:29+00:00\" \/>\n<meta name=\"author\" content=\"Dr. Benjamin Anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"Dr. Benjamin Anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"2 Minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/de\/pandas-groupby-resample\/\",\"url\":\"https:\/\/statorials.org\/de\/pandas-groupby-resample\/\",\"name\":\"Pandas: So resampeln Sie Zeitreihen mit groupby() \u2013 Statorials\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/de\/#website\"},\"datePublished\":\"2023-07-12T15:37:29+00:00\",\"dateModified\":\"2023-07-12T15:37:29+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/de\/#\/schema\/person\/ec75c4d6365f2708f8a0ad3a42121aa0\"},\"description\":\"In diesem Tutorial wird erl\u00e4utert, wie eine Zeitreihe in Pandas unter Verwendung der Groupby-Operation erneut abgetastet wird, einschlie\u00dflich eines Beispiels.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/de\/pandas-groupby-resample\/#breadcrumb\"},\"inLanguage\":\"de-DE\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/de\/pandas-groupby-resample\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/de\/pandas-groupby-resample\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Heim\",\"item\":\"https:\/\/statorials.org\/de\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Pandas: wie man zeitreihen mit groupby() neu abtastet\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/de\/#website\",\"url\":\"https:\/\/statorials.org\/de\/\",\"name\":\"Statorials\",\"description\":\"Ihr Leitfaden f\u00fcr statistische Kompetenz !\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/de\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"de-DE\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/de\/#\/schema\/person\/ec75c4d6365f2708f8a0ad3a42121aa0\",\"name\":\"Dr. Benjamin Anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de-DE\",\"@id\":\"https:\/\/statorials.org\/de\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/statorials.org\/de\/wp-content\/uploads\/2023\/11\/Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"https:\/\/statorials.org\/de\/wp-content\/uploads\/2023\/11\/Benjamin-Anderson-96x96.jpg\",\"caption\":\"Dr. Benjamin Anderson\"},\"description\":\"Hallo, ich bin Benjamin, ein pensionierter Statistikprofessor, der sich zum engagierten Statorials-Lehrer entwickelt hat. Mit umfassender Erfahrung und Fachwissen auf dem Gebiet der Statistik bin ich bestrebt, mein Wissen zu teilen, um Studenten durch Statorials zu bef\u00e4higen. Mehr wissen\",\"sameAs\":[\"https:\/\/statorials.org\/de\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Pandas: So resampeln Sie Zeitreihen mit groupby() \u2013 Statorials","description":"In diesem Tutorial wird erl\u00e4utert, wie eine Zeitreihe in Pandas unter Verwendung der Groupby-Operation erneut abgetastet wird, einschlie\u00dflich eines Beispiels.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/de\/pandas-groupby-resample\/","og_locale":"de_DE","og_type":"article","og_title":"Pandas: So resampeln Sie Zeitreihen mit groupby() \u2013 Statorials","og_description":"In diesem Tutorial wird erl\u00e4utert, wie eine Zeitreihe in Pandas unter Verwendung der Groupby-Operation erneut abgetastet wird, einschlie\u00dflich eines Beispiels.","og_url":"https:\/\/statorials.org\/de\/pandas-groupby-resample\/","og_site_name":"Statorials","article_published_time":"2023-07-12T15:37:29+00:00","author":"Dr. Benjamin Anderson","twitter_card":"summary_large_image","twitter_misc":{"Verfasst von":"Dr. Benjamin Anderson","Gesch\u00e4tzte Lesezeit":"2 Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/de\/pandas-groupby-resample\/","url":"https:\/\/statorials.org\/de\/pandas-groupby-resample\/","name":"Pandas: So resampeln Sie Zeitreihen mit groupby() \u2013 Statorials","isPartOf":{"@id":"https:\/\/statorials.org\/de\/#website"},"datePublished":"2023-07-12T15:37:29+00:00","dateModified":"2023-07-12T15:37:29+00:00","author":{"@id":"https:\/\/statorials.org\/de\/#\/schema\/person\/ec75c4d6365f2708f8a0ad3a42121aa0"},"description":"In diesem Tutorial wird erl\u00e4utert, wie eine Zeitreihe in Pandas unter Verwendung der Groupby-Operation erneut abgetastet wird, einschlie\u00dflich eines Beispiels.","breadcrumb":{"@id":"https:\/\/statorials.org\/de\/pandas-groupby-resample\/#breadcrumb"},"inLanguage":"de-DE","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/de\/pandas-groupby-resample\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/de\/pandas-groupby-resample\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Heim","item":"https:\/\/statorials.org\/de\/"},{"@type":"ListItem","position":2,"name":"Pandas: wie man zeitreihen mit groupby() neu abtastet"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/de\/#website","url":"https:\/\/statorials.org\/de\/","name":"Statorials","description":"Ihr Leitfaden f\u00fcr statistische Kompetenz !","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/de\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"de-DE"},{"@type":"Person","@id":"https:\/\/statorials.org\/de\/#\/schema\/person\/ec75c4d6365f2708f8a0ad3a42121aa0","name":"Dr. Benjamin Anderson","image":{"@type":"ImageObject","inLanguage":"de-DE","@id":"https:\/\/statorials.org\/de\/#\/schema\/person\/image\/","url":"https:\/\/statorials.org\/de\/wp-content\/uploads\/2023\/11\/Benjamin-Anderson-96x96.jpg","contentUrl":"https:\/\/statorials.org\/de\/wp-content\/uploads\/2023\/11\/Benjamin-Anderson-96x96.jpg","caption":"Dr. Benjamin Anderson"},"description":"Hallo, ich bin Benjamin, ein pensionierter Statistikprofessor, der sich zum engagierten Statorials-Lehrer entwickelt hat. Mit umfassender Erfahrung und Fachwissen auf dem Gebiet der Statistik bin ich bestrebt, mein Wissen zu teilen, um Studenten durch Statorials zu bef\u00e4higen. Mehr wissen","sameAs":["https:\/\/statorials.org\/de"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/posts\/4234"}],"collection":[{"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/comments?post=4234"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/posts\/4234\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/media?parent=4234"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/categories?post=4234"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/tags?post=4234"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}