{"id":3764,"date":"2023-07-15T16:32:02","date_gmt":"2023-07-15T16:32:02","guid":{"rendered":"https:\/\/statorials.org\/de\/pandas-groupby-diff\/"},"modified":"2023-07-15T16:32:02","modified_gmt":"2023-07-15T16:32:02","slug":"pandas-groupby-diff","status":"publish","type":"post","link":"https:\/\/statorials.org\/de\/pandas-groupby-diff\/","title":{"rendered":"Pandas: so verwenden sie groupby mit diff"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\">Sie k\u00f6nnen die folgende grundlegende Syntax verwenden, um die Funktion <strong>\u201egroupby()\u201c<\/strong> mit der Funktion <strong>\u201ediff()\u201c<\/strong> in Pandas zu verwenden:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong>df = df. <span style=\"color: #3366ff;\">sort_values<\/span> (by=[' <span style=\"color: #ff0000;\">group_var1<\/span> ', ' <span style=\"color: #ff0000;\">group_var2<\/span> '])\n\ndf[' <span style=\"color: #ff0000;\">diff<\/span> '] = df. <span style=\"color: #3366ff;\">groupby<\/span> ([' <span style=\"color: #ff0000;\">group_var1<\/span> '])[' <span style=\"color: #ff0000;\">values_var<\/span> ']. <span style=\"color: #3366ff;\">diff<\/span> (). <span style=\"color: #3366ff;\">fillna<\/span> ( <span style=\"color: #008000;\">0<\/span> )\n<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">In diesem speziellen Beispiel werden die Zeilen des DataFrame nach zwei spezifischen Variablen sortiert, dann nach <strong>\u201egroup_var1\u201c<\/strong> gruppiert und die Differenz zwischen den Zeilen in der Spalte <strong>\u201evalues_var\u201c<\/strong> berechnet.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Beachten Sie, dass <strong>fillna(0)<\/strong> Pandas anweist, immer dann eine Null einzuf\u00fcgen, wenn sich der Wert der Gruppenvariablen zwischen aufeinanderfolgenden Zeilen im DataFrame \u00e4ndert.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Das folgende Beispiel zeigt, wie diese Syntax in der Praxis verwendet wird.<\/span><\/p>\n<h2> <span style=\"color: #000000;\"><strong>Beispiel: So verwenden Sie Groupby mit Diff in Pandas<\/strong><\/span><\/h2>\n<p> <span style=\"color: #000000;\">Angenommen, wir haben den folgenden Pandas-DataFrame, der die Gesamtverk\u00e4ufe zweier verschiedener Gesch\u00e4fte zu unterschiedlichen Daten enth\u00e4lt:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <b><span style=\"color: #008000;\">import<\/span> pandas <span style=\"color: #008000;\">as<\/span> pd\n\n<span style=\"color: #008080;\">#createDataFrame<\/span>\ndf = pd. <span style=\"color: #3366ff;\">DataFrame<\/span> ({' <span style=\"color: #ff0000;\">store<\/span> ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],\n                   ' <span style=\"color: #ff0000;\">date<\/span> ': pd. <span style=\"color: #3366ff;\">to_datetime<\/span> (['2022-01-01', '2022-01-02',\n                                           '2022-01-03', '2022-01-04',\n                                           '2022-01-01', '2022-01-02',\n                                           '2022-01-03', '2022-01-04']),\n                   ' <span style=\"color: #ff0000;\">sales<\/span> ': [12, 15, 24, 24, 14, 19, 12, 38]})\n\n<span style=\"color: #008080;\">#view DataFrame\n<\/span><span style=\"color: #008000;\">print<\/span> (df)\n\n  blind date sales\n0 A 2022-01-01 12\n1 A 2022-01-02 15\n2 A 2022-01-03 24\n3 A 2022-01-04 24\n4 B 2022-01-01 14\n5 B 2022-01-02 19\n6 B 2022-01-03 12\n7 B 2022-01-04 38<\/b><\/pre>\n<p> <span style=\"color: #000000;\">Nehmen wir nun an, wir m\u00f6chten eine neue Spalte namens <strong>sales_diff<\/strong> erstellen, die die Differenz der Verkaufswerte zwischen aufeinanderfolgenden Daten enth\u00e4lt, gruppiert nach Filiale.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Wir k\u00f6nnen dazu die folgende Syntax verwenden:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\"><span style=\"color: #000000;\"><span style=\"color: #008080;\">#sort DataFrame by store and date\n<\/span>df = df. <span style=\"color: #3366ff;\">sort_values<\/span> (by=[' <span style=\"color: #ff0000;\">store<\/span> ', ' <span style=\"color: #ff0000;\">date<\/span> '])\n\n<span style=\"color: #008080;\">#create new column that contains difference between sales grouped by store\n<\/span>df[' <span style=\"color: #ff0000;\">sales_diff<\/span> '] = df. <span style=\"color: #3366ff;\">groupby<\/span> ([' <span style=\"color: #ff0000;\">store<\/span> '])[' <span style=\"color: #ff0000;\">sales<\/span> ']. <span style=\"color: #3366ff;\">diff<\/span> (). <span style=\"color: #3366ff;\">fillna<\/span> ( <span style=\"color: #008000;\">0<\/span> )\n\n<span style=\"color: #008080;\">#view update DataFrame\n<\/span><span style=\"color: #008000;\">print<\/span> (df)\n\n  store date sales sales_diff\n0 A 2022-01-01 12 0.0\n1 A 2022-01-02 15 3.0\n2 A 2022-01-03 24 9.0\n3 A 2022-01-04 24 0.0\n4 B 2022-01-01 14 0.0\n5 B 2022-01-02 19 5.0\n6 B 2022-01-03 12 -7.0\n7 B 2022-01-04 38 26.0\n<\/span><\/span><\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Die neue Spalte <strong>\u201esales_diff\u201c<\/strong> enth\u00e4lt die Differenz der Verkaufswerte zwischen aufeinanderfolgenden Daten, gruppiert nach Filiale.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Wir k\u00f6nnen zum Beispiel sehen:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Der Unterschied in den Ums\u00e4tzen von Gesch\u00e4ft A zwischen dem 01.01.2022 und dem 01.02.2022 betr\u00e4gt <strong>3<\/strong> .<\/span><\/li>\n<li> <span style=\"color: #000000;\">Die Umsatzdifferenz von Gesch\u00e4ft A zwischen dem 01.02.2022 und dem 01.03.2022 betr\u00e4gt <strong>9<\/strong> .<\/span><\/li>\n<li> <span style=\"color: #000000;\">Der Unterschied in den Ums\u00e4tzen von Gesch\u00e4ft A zwischen dem 03.01.2022 und dem 04.01.2022 betr\u00e4gt <strong>0<\/strong> .<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Und so weiter.<\/span><\/p>\n<h2> <span style=\"color: #000000;\"><strong>Zus\u00e4tzliche Ressourcen<\/strong><\/span><\/h2>\n<p> <span style=\"color: #000000;\">In den folgenden Tutorials wird erl\u00e4utert, wie andere g\u00e4ngige Vorg\u00e4nge in Pandas ausgef\u00fchrt werden:<\/span><\/p>\n<p> <a href=\"https:\/\/statorials.org\/de\/pandas-groupby-summe\/\" target=\"_blank\" rel=\"noopener\">So f\u00fchren Sie eine GroupBy-Summe in Pandas durch<\/a><br \/><a href=\"https:\/\/statorials.org\/de\/pandas-gruppieren-nach-handlung\/\" target=\"_blank\" rel=\"noopener\">So verwenden Sie Groupby und Plot in Pandas<\/a><br \/> <a href=\"https:\/\/statorials.org\/de\/pandas-groupby-count-unique\/\" target=\"_blank\" rel=\"noopener\">So z\u00e4hlen Sie eindeutige Werte mit GroupBy in Pandas<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Sie k\u00f6nnen die folgende grundlegende Syntax verwenden, um die Funktion \u201egroupby()\u201c mit der Funktion \u201ediff()\u201c in Pandas zu verwenden: df = df. sort_values (by=[&#8218; group_var1 &#8218;, &#8218; group_var2 &#8218;]) df[&#8218; diff &#8218;] = df. groupby ([&#8218; group_var1 &#8218;])[&#8218; values_var &#8218;]. diff (). fillna ( 0 ) In diesem speziellen Beispiel werden die Zeilen des DataFrame [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Pandas: So verwenden Sie Groupby mit Diff \u2013 Statistik<\/title>\n<meta name=\"description\" content=\"In diesem Tutorial wird anhand eines Beispiels erl\u00e4utert, wie die Groupby-Funktion mit der Diff-Funktion in Pandas verwendet wird.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/de\/pandas-groupby-diff\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Pandas: So verwenden Sie Groupby mit Diff \u2013 Statistik\" \/>\n<meta property=\"og:description\" content=\"In diesem Tutorial wird anhand eines Beispiels erl\u00e4utert, wie die Groupby-Funktion mit der Diff-Funktion in Pandas verwendet wird.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/de\/pandas-groupby-diff\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-15T16:32:02+00:00\" \/>\n<meta name=\"author\" content=\"Dr. Benjamin Anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"Dr. Benjamin Anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"2 Minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/de\/pandas-groupby-diff\/\",\"url\":\"https:\/\/statorials.org\/de\/pandas-groupby-diff\/\",\"name\":\"Pandas: So verwenden Sie Groupby mit Diff \u2013 Statistik\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/de\/#website\"},\"datePublished\":\"2023-07-15T16:32:02+00:00\",\"dateModified\":\"2023-07-15T16:32:02+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/de\/#\/schema\/person\/ec75c4d6365f2708f8a0ad3a42121aa0\"},\"description\":\"In diesem Tutorial wird anhand eines Beispiels erl\u00e4utert, wie die Groupby-Funktion mit der Diff-Funktion in Pandas verwendet wird.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/de\/pandas-groupby-diff\/#breadcrumb\"},\"inLanguage\":\"de-DE\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/de\/pandas-groupby-diff\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/de\/pandas-groupby-diff\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Heim\",\"item\":\"https:\/\/statorials.org\/de\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Pandas: so verwenden sie groupby mit diff\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/de\/#website\",\"url\":\"https:\/\/statorials.org\/de\/\",\"name\":\"Statorials\",\"description\":\"Ihr Leitfaden f\u00fcr statistische Kompetenz !\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/de\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"de-DE\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/de\/#\/schema\/person\/ec75c4d6365f2708f8a0ad3a42121aa0\",\"name\":\"Dr. Benjamin Anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de-DE\",\"@id\":\"https:\/\/statorials.org\/de\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/statorials.org\/de\/wp-content\/uploads\/2023\/11\/Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"https:\/\/statorials.org\/de\/wp-content\/uploads\/2023\/11\/Benjamin-Anderson-96x96.jpg\",\"caption\":\"Dr. Benjamin Anderson\"},\"description\":\"Hallo, ich bin Benjamin, ein pensionierter Statistikprofessor, der sich zum engagierten Statorials-Lehrer entwickelt hat. Mit umfassender Erfahrung und Fachwissen auf dem Gebiet der Statistik bin ich bestrebt, mein Wissen zu teilen, um Studenten durch Statorials zu bef\u00e4higen. Mehr wissen\",\"sameAs\":[\"https:\/\/statorials.org\/de\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Pandas: So verwenden Sie Groupby mit Diff \u2013 Statistik","description":"In diesem Tutorial wird anhand eines Beispiels erl\u00e4utert, wie die Groupby-Funktion mit der Diff-Funktion in Pandas verwendet wird.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/de\/pandas-groupby-diff\/","og_locale":"de_DE","og_type":"article","og_title":"Pandas: So verwenden Sie Groupby mit Diff \u2013 Statistik","og_description":"In diesem Tutorial wird anhand eines Beispiels erl\u00e4utert, wie die Groupby-Funktion mit der Diff-Funktion in Pandas verwendet wird.","og_url":"https:\/\/statorials.org\/de\/pandas-groupby-diff\/","og_site_name":"Statorials","article_published_time":"2023-07-15T16:32:02+00:00","author":"Dr. Benjamin Anderson","twitter_card":"summary_large_image","twitter_misc":{"Verfasst von":"Dr. Benjamin Anderson","Gesch\u00e4tzte Lesezeit":"2 Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/de\/pandas-groupby-diff\/","url":"https:\/\/statorials.org\/de\/pandas-groupby-diff\/","name":"Pandas: So verwenden Sie Groupby mit Diff \u2013 Statistik","isPartOf":{"@id":"https:\/\/statorials.org\/de\/#website"},"datePublished":"2023-07-15T16:32:02+00:00","dateModified":"2023-07-15T16:32:02+00:00","author":{"@id":"https:\/\/statorials.org\/de\/#\/schema\/person\/ec75c4d6365f2708f8a0ad3a42121aa0"},"description":"In diesem Tutorial wird anhand eines Beispiels erl\u00e4utert, wie die Groupby-Funktion mit der Diff-Funktion in Pandas verwendet wird.","breadcrumb":{"@id":"https:\/\/statorials.org\/de\/pandas-groupby-diff\/#breadcrumb"},"inLanguage":"de-DE","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/de\/pandas-groupby-diff\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/de\/pandas-groupby-diff\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Heim","item":"https:\/\/statorials.org\/de\/"},{"@type":"ListItem","position":2,"name":"Pandas: so verwenden sie groupby mit diff"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/de\/#website","url":"https:\/\/statorials.org\/de\/","name":"Statorials","description":"Ihr Leitfaden f\u00fcr statistische Kompetenz !","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/de\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"de-DE"},{"@type":"Person","@id":"https:\/\/statorials.org\/de\/#\/schema\/person\/ec75c4d6365f2708f8a0ad3a42121aa0","name":"Dr. Benjamin Anderson","image":{"@type":"ImageObject","inLanguage":"de-DE","@id":"https:\/\/statorials.org\/de\/#\/schema\/person\/image\/","url":"https:\/\/statorials.org\/de\/wp-content\/uploads\/2023\/11\/Benjamin-Anderson-96x96.jpg","contentUrl":"https:\/\/statorials.org\/de\/wp-content\/uploads\/2023\/11\/Benjamin-Anderson-96x96.jpg","caption":"Dr. Benjamin Anderson"},"description":"Hallo, ich bin Benjamin, ein pensionierter Statistikprofessor, der sich zum engagierten Statorials-Lehrer entwickelt hat. Mit umfassender Erfahrung und Fachwissen auf dem Gebiet der Statistik bin ich bestrebt, mein Wissen zu teilen, um Studenten durch Statorials zu bef\u00e4higen. Mehr wissen","sameAs":["https:\/\/statorials.org\/de"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/posts\/3764"}],"collection":[{"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/comments?post=3764"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/posts\/3764\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/media?parent=3764"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/categories?post=3764"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/tags?post=3764"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}