{"id":828,"date":"2023-07-28T14:58:44","date_gmt":"2023-07-28T14:58:44","guid":{"rendered":"https:\/\/statorials.org\/de\/ausreisser-entfernen-python\/"},"modified":"2023-07-28T14:58:44","modified_gmt":"2023-07-28T14:58:44","slug":"ausreisser-entfernen-python","status":"publish","type":"post","link":"https:\/\/statorials.org\/de\/ausreisser-entfernen-python\/","title":{"rendered":"So entfernen sie ausrei\u00dfer in python"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\">Ein <strong>Ausrei\u00dfer<\/strong> ist eine Beobachtung, die ungew\u00f6hnlich weit von anderen Werten in einem Datensatz entfernt ist. Ausrei\u00dfer k\u00f6nnen problematisch sein, da sie die Ergebnisse einer Analyse beeinflussen k\u00f6nnen.<\/span><\/p>\n<p> <span style=\"color: #000000;\">In diesem Tutorial wird erl\u00e4utert, wie Sie Ausrei\u00dfer in Python identifizieren und entfernen.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>So identifizieren Sie Ausrei\u00dfer in Python<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Bevor Sie Ausrei\u00dfer entfernen k\u00f6nnen, m\u00fcssen Sie zun\u00e4chst entscheiden, was Sie als Ausrei\u00dfer betrachten. Es gibt zwei g\u00e4ngige Methoden, dies zu tun:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>1. Nutzen Sie den Interquartilbereich.<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Der Interquartilbereich (IQR) ist die Differenz zwischen dem 75. Perzentil (Q3) und dem 25. Perzentil (Q1) in einem Datensatz. Es misst die Verteilung der durchschnittlichen 50 % der Werte.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Sie k\u00f6nnen eine Beobachtung als Ausrei\u00dfer definieren, wenn sie das 1,5-fache des Interquartilbereichs \u00fcber dem dritten Quartil (Q3) oder das 1,5-fache des Interquartilbereichs unter dem ersten Quartil (Q1) betr\u00e4gt.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Ausrei\u00dfer = Beobachtungen &gt; Q3 + 1,5*IQR oder Q1 \u2013 1,5*IQR<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>2. Verwenden Sie Z-Scores.<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Ein <a href=\"https:\/\/statorials.org\/de\/z-score-python\/\" target=\"_blank\" rel=\"noopener\">Z-Score<\/a> sagt Ihnen, wie viele Standardabweichungen ein bestimmter Wert vom Mittelwert hat. Wir verwenden die folgende Formel, um einen Z-Score zu berechnen:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>z<\/strong> = (X \u2013 \u03bc) \/ \u03c3<\/span><\/p>\n<p> <span style=\"color: #000000;\">Gold:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">X ist ein einzelner Rohdatenwert<\/span><\/li>\n<li> <span style=\"color: #000000;\">\u03bc ist der Bev\u00f6lkerungsmittelwert<\/span><\/li>\n<li> <span style=\"color: #000000;\">\u03c3 ist die Populationsstandardabweichung<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Sie k\u00f6nnen eine Beobachtung als Ausrei\u00dfer definieren, wenn ihr Z-Score kleiner als -3 oder gr\u00f6\u00dfer als 3 ist.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Ausrei\u00dfer = Beobachtungen mit Z-Scores &gt; 3 oder &lt; -3<\/strong><\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>So entfernen Sie Ausrei\u00dfer in Python<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Sobald Sie entschieden haben, was Sie als Ausrei\u00dfer betrachten, k\u00f6nnen Sie diese identifizieren und aus einem Datensatz entfernen. Um dies zu veranschaulichen, verwenden wir den folgenden Pandas-DataFrame:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #107d3f;\">import<\/span> numpy <span style=\"color: #107d3f;\">as<\/span> np\n<span style=\"color: #107d3f;\">import <span style=\"color: #000000;\">pandas<\/span> as <span style=\"color: #000000;\">pd<\/span> \nimport<\/span> scipy.stats <span style=\"color: #107d3f;\">as<\/span> stats\n\n<span style=\"color: #008080;\">#create dataframe with three columns 'A', 'B', 'C'<\/span>\nnp.random.seed(10)\ndata = pd.DataFrame(np.random.randint(0, 10, size=(100, 3)), columns=['A', 'B', 'C'])\n<span style=\"color: #008080;\">\n#view first 10 rows<\/span>\ndata[:10]\n\n           ABC\n0 13.315865 7.152790 -15.454003\n1 -0.083838 6.213360 -7.200856\n2 2.655116 1.085485 0.042914\n3 -1.746002 4.330262 12.030374\n4 -9.650657 10.282741 2.286301\n5 4.451376 -11.366022 1.351369\n6 14.845370 -10.798049 -19.777283\n7 -17.433723 2.660702 23.849673\n8 11.236913 16.726222 0.991492\n9 13.979964 -2.712480 6.132042\n<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Anschlie\u00dfend k\u00f6nnen wir Ausrei\u00dfer mithilfe der Z-Score-Methode oder der Interquartilbereichsmethode definieren und entfernen:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Z-Score-Methode:<\/strong><\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#find absolute value of z-score for each observation<\/span>\nz = np.abs(stats.zscore(data))\n\n<span style=\"color: #008080;\">#only keep rows in dataframe with all z-scores less than absolute value of 3<\/span> \ndata_clean = data[(z&lt;3).all(axis=1)]\n\n<span style=\"color: #008080;\">#find how many rows are left in the dataframe<\/span> \ndata_clean.shape\n\n(99.3)\n<\/strong><\/pre>\n<p> <span style=\"color: #000000;\"><strong>Interquartilbereichsmethode:<\/strong><\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#find Q1, Q3, and interquartile range for each column<\/span>\nQ1 = data.quantile(q=.25)\nQ3 = data.quantile(q=.75)\nIQR = data.apply(stats.iqr)\n\n<span style=\"color: #008080;\">#only keep rows in dataframe that have values within 1.5*IQR of Q1 and Q3<\/span>\ndata_clean = data[~((data &lt; (Q1-1.5*IQR)) | (data &gt; (Q3+1.5*IQR))).any(axis=1)]\n<span style=\"color: #008080;\">\n#find how many rows are left in the dataframe<\/span> \ndata_clean.shape\n\n(89.3)<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Wir k\u00f6nnen sehen, dass die Za-Score-Methode eine Beobachtung als Ausrei\u00dfer identifizierte und entfernte, w\u00e4hrend die Interquartilbereichsmethode insgesamt 11 Beobachtungen als Ausrei\u00dfer identifizierte und entfernte.<\/span><\/p>\n<h3> <strong>Wann Ausrei\u00dfer entfernt werden sollten<\/strong><\/h3>\n<p> <span style=\"color: #000000;\">Wenn in Ihren Daten ein oder mehrere Ausrei\u00dfer vorhanden sind, m\u00fcssen Sie zun\u00e4chst sicherstellen, dass diese nicht auf einen Dateneingabefehler zur\u00fcckzuf\u00fchren sind. Manchmal gibt eine Person beim Speichern der Daten einfach den falschen Datenwert ein.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Wenn sich herausstellt, dass der Ausrei\u00dfer das Ergebnis eines Dateneingabefehlers ist, k\u00f6nnen Sie ihm einen neuen Wert zuweisen, beispielsweise<\/span> <a href=\"https:\/\/statorials.org\/de\/misst-die-zentrale-tendenz\/\" target=\"_blank\" rel=\"noopener\">den Mittelwert oder Median<\/a> <span style=\"color: #000000;\">des Datensatzes.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Wenn der Wert wirklich ein Ausrei\u00dfer ist, k\u00f6nnen Sie ihn entfernen, wenn er erhebliche Auswirkungen auf Ihre Gesamtanalyse hat. Erw\u00e4hnen Sie in Ihrem Abschlussbericht oder Ihrer Analyse unbedingt, dass Sie einen Ausrei\u00dfer entfernt haben.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Zus\u00e4tzliche Ressourcen<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Wenn Sie mit mehreren Variablen gleichzeitig arbeiten, m\u00f6chten Sie m\u00f6glicherweise <a href=\"https:\/\/statorials.org\/de\/mahalanobis-remote-python\/\" target=\"_blank\" rel=\"noopener\">die Mahalanobis-Distanz<\/a> verwenden, um Ausrei\u00dfer zu erkennen.<\/span><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Ein Ausrei\u00dfer ist eine Beobachtung, die ungew\u00f6hnlich weit von anderen Werten in einem Datensatz entfernt ist. Ausrei\u00dfer k\u00f6nnen problematisch sein, da sie die Ergebnisse einer Analyse beeinflussen k\u00f6nnen. In diesem Tutorial wird erl\u00e4utert, wie Sie Ausrei\u00dfer in Python identifizieren und entfernen. So identifizieren Sie Ausrei\u00dfer in Python Bevor Sie Ausrei\u00dfer entfernen k\u00f6nnen, m\u00fcssen Sie zun\u00e4chst [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>So entfernen Sie Ausrei\u00dfer in Python \u2013 Statorials<\/title>\n<meta name=\"description\" content=\"Eine einfache Erkl\u00e4rung zum Identifizieren und Entfernen von Ausrei\u00dfern in Python.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/de\/ausreisser-entfernen-python\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"So entfernen Sie Ausrei\u00dfer in Python \u2013 Statorials\" \/>\n<meta property=\"og:description\" content=\"Eine einfache Erkl\u00e4rung zum Identifizieren und Entfernen von Ausrei\u00dfern in Python.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/de\/ausreisser-entfernen-python\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-28T14:58:44+00:00\" \/>\n<meta name=\"author\" content=\"Dr. Benjamin Anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"Dr. Benjamin Anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"3 Minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/de\/ausreisser-entfernen-python\/\",\"url\":\"https:\/\/statorials.org\/de\/ausreisser-entfernen-python\/\",\"name\":\"So entfernen Sie Ausrei\u00dfer in Python \u2013 Statorials\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/de\/#website\"},\"datePublished\":\"2023-07-28T14:58:44+00:00\",\"dateModified\":\"2023-07-28T14:58:44+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/de\/#\/schema\/person\/ec75c4d6365f2708f8a0ad3a42121aa0\"},\"description\":\"Eine einfache Erkl\u00e4rung zum Identifizieren und Entfernen von Ausrei\u00dfern in Python.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/de\/ausreisser-entfernen-python\/#breadcrumb\"},\"inLanguage\":\"de-DE\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/de\/ausreisser-entfernen-python\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/de\/ausreisser-entfernen-python\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Heim\",\"item\":\"https:\/\/statorials.org\/de\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"So entfernen sie ausrei\u00dfer in python\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/de\/#website\",\"url\":\"https:\/\/statorials.org\/de\/\",\"name\":\"Statorials\",\"description\":\"Ihr Leitfaden f\u00fcr statistische Kompetenz !\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/de\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"de-DE\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/de\/#\/schema\/person\/ec75c4d6365f2708f8a0ad3a42121aa0\",\"name\":\"Dr. Benjamin Anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de-DE\",\"@id\":\"https:\/\/statorials.org\/de\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/statorials.org\/de\/wp-content\/uploads\/2023\/11\/Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"https:\/\/statorials.org\/de\/wp-content\/uploads\/2023\/11\/Benjamin-Anderson-96x96.jpg\",\"caption\":\"Dr. Benjamin Anderson\"},\"description\":\"Hallo, ich bin Benjamin, ein pensionierter Statistikprofessor, der sich zum engagierten Statorials-Lehrer entwickelt hat. Mit umfassender Erfahrung und Fachwissen auf dem Gebiet der Statistik bin ich bestrebt, mein Wissen zu teilen, um Studenten durch Statorials zu bef\u00e4higen. Mehr wissen\",\"sameAs\":[\"https:\/\/statorials.org\/de\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"So entfernen Sie Ausrei\u00dfer in Python \u2013 Statorials","description":"Eine einfache Erkl\u00e4rung zum Identifizieren und Entfernen von Ausrei\u00dfern in Python.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/de\/ausreisser-entfernen-python\/","og_locale":"de_DE","og_type":"article","og_title":"So entfernen Sie Ausrei\u00dfer in Python \u2013 Statorials","og_description":"Eine einfache Erkl\u00e4rung zum Identifizieren und Entfernen von Ausrei\u00dfern in Python.","og_url":"https:\/\/statorials.org\/de\/ausreisser-entfernen-python\/","og_site_name":"Statorials","article_published_time":"2023-07-28T14:58:44+00:00","author":"Dr. Benjamin Anderson","twitter_card":"summary_large_image","twitter_misc":{"Verfasst von":"Dr. Benjamin Anderson","Gesch\u00e4tzte Lesezeit":"3 Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/de\/ausreisser-entfernen-python\/","url":"https:\/\/statorials.org\/de\/ausreisser-entfernen-python\/","name":"So entfernen Sie Ausrei\u00dfer in Python \u2013 Statorials","isPartOf":{"@id":"https:\/\/statorials.org\/de\/#website"},"datePublished":"2023-07-28T14:58:44+00:00","dateModified":"2023-07-28T14:58:44+00:00","author":{"@id":"https:\/\/statorials.org\/de\/#\/schema\/person\/ec75c4d6365f2708f8a0ad3a42121aa0"},"description":"Eine einfache Erkl\u00e4rung zum Identifizieren und Entfernen von Ausrei\u00dfern in Python.","breadcrumb":{"@id":"https:\/\/statorials.org\/de\/ausreisser-entfernen-python\/#breadcrumb"},"inLanguage":"de-DE","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/de\/ausreisser-entfernen-python\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/de\/ausreisser-entfernen-python\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Heim","item":"https:\/\/statorials.org\/de\/"},{"@type":"ListItem","position":2,"name":"So entfernen sie ausrei\u00dfer in python"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/de\/#website","url":"https:\/\/statorials.org\/de\/","name":"Statorials","description":"Ihr Leitfaden f\u00fcr statistische Kompetenz !","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/de\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"de-DE"},{"@type":"Person","@id":"https:\/\/statorials.org\/de\/#\/schema\/person\/ec75c4d6365f2708f8a0ad3a42121aa0","name":"Dr. Benjamin Anderson","image":{"@type":"ImageObject","inLanguage":"de-DE","@id":"https:\/\/statorials.org\/de\/#\/schema\/person\/image\/","url":"https:\/\/statorials.org\/de\/wp-content\/uploads\/2023\/11\/Benjamin-Anderson-96x96.jpg","contentUrl":"https:\/\/statorials.org\/de\/wp-content\/uploads\/2023\/11\/Benjamin-Anderson-96x96.jpg","caption":"Dr. Benjamin Anderson"},"description":"Hallo, ich bin Benjamin, ein pensionierter Statistikprofessor, der sich zum engagierten Statorials-Lehrer entwickelt hat. Mit umfassender Erfahrung und Fachwissen auf dem Gebiet der Statistik bin ich bestrebt, mein Wissen zu teilen, um Studenten durch Statorials zu bef\u00e4higen. Mehr wissen","sameAs":["https:\/\/statorials.org\/de"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/posts\/828"}],"collection":[{"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/comments?post=828"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/posts\/828\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/media?parent=828"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/categories?post=828"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/tags?post=828"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}