{"id":1313,"date":"2023-07-26T22:01:06","date_gmt":"2023-07-26T22:01:06","guid":{"rendered":"https:\/\/statorials.org\/de\/kitchen-remote-python\/"},"modified":"2023-07-26T22:01:06","modified_gmt":"2023-07-26T22:01:06","slug":"kitchen-remote-python","status":"publish","type":"post","link":"https:\/\/statorials.org\/de\/kitchen-remote-python\/","title":{"rendered":"So berechnen sie die cook-distanz in python"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\"><strong>Die Cook-Distanz<\/strong> wird verwendet, um einflussreiche <a href=\"https:\/\/statorials.org\/de\/beobachtung-in-der-statistik\/\" target=\"_blank\" rel=\"noopener\">Beobachtungen<\/a> in einem Regressionsmodell zu identifizieren.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Die Formel f\u00fcr die Cook-Distanz lautet:<\/span><\/p>\n<p style=\"text-align: center;\"> <span style=\"color: #000000;\"><strong>d <sub>i<\/sub><\/strong> = (r <sub>i<\/sub> <sup>2<\/sup> \/ p*MSE) * (h <sub>ii<\/sub> \/ (1-h <sub>ii<\/sub> ) <sup>2<\/sup> )<\/span><\/p>\n<p> <span style=\"color: #000000;\">Gold:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\"><strong>r<\/strong> <sub><strong>i<\/strong><\/sub> ist der i <sup>-te<\/sup> Rest<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>p<\/strong> ist die Anzahl der Koeffizienten im Regressionsmodell<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>MSE<\/strong> ist der mittlere quadratische Fehler<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>h<\/strong> <sub>ii<\/sub> ist der <sup>i-te<\/sup> Hebelwert<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Im Wesentlichen misst die Cook-Distanz, wie stark sich alle angepassten Werte des Modells \u00e4ndern, wenn die i- <sup>te<\/sup> Beobachtung entfernt wird.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Je gr\u00f6\u00dfer der Wert der Cook-Distanz ist, desto einflussreicher ist eine bestimmte Beobachtung.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Als allgemeine Regel gilt, dass jede Beobachtung mit einer Cook-Distanz von mehr als 4\/n (wobei <em>n<\/em> = Gesamtbeobachtungen) einen gro\u00dfen Einfluss hat.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Dieses Tutorial bietet ein schrittweises Beispiel f\u00fcr die Berechnung der Cook-Distanz f\u00fcr ein bestimmtes Regressionsmodell in Python.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Schritt 1: Geben Sie die Daten ein<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Zuerst erstellen wir einen kleinen Datensatz, mit dem wir in Python arbeiten k\u00f6nnen:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008000;\">import<\/span> pandas <span style=\"color: #008000;\">as<\/span> pd\n\n<span style=\"color: #008080;\">#create dataset\n<\/span>df = pd. <span style=\"color: #3366ff;\">DataFrame<\/span> ({' <span style=\"color: #008000;\">x<\/span> ': [8, 12, 12, 13, 14, 16, 17, 22, 24, 26, 29, 30],\n                   ' <span style=\"color: #008000;\">y<\/span> ': [41, 42, 39, 37, 35, 39, 45, 46, 39, 49, 55, 57]})\n<\/strong><\/pre>\n<h3> <span style=\"color: #000000;\"><strong>Schritt 2: Passen Sie das Regressionsmodell an<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Als n\u00e4chstes passen wir ein <a href=\"https:\/\/statorials.org\/de\/einfache-lineare-regression-in-python\/\" target=\"_blank\" rel=\"noopener\">einfaches lineares Regressionsmodell<\/a> an:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <span style=\"color: #000000;\"><strong><span style=\"color: #008000;\">import<\/span> statsmodels. <span style=\"color: #3366ff;\">api<\/span> <span style=\"color: #008000;\">as<\/span> sm\n\n<span style=\"color: #008080;\">#define response variable\n<\/span>y = df[' <span style=\"color: #008000;\">y<\/span> ']\n\n<span style=\"color: #008080;\">#define explanatory variable\n<\/span>x = df[' <span style=\"color: #008000;\">x<\/span> ']\n\n<span style=\"color: #008080;\">#add constant to predictor variables\n<\/span>x = sm. <span style=\"color: #3366ff;\">add_constant<\/span> (x)\n\n<span style=\"color: #008080;\">#fit linear regression model\n<\/span>model = sm. <span style=\"color: #3366ff;\">OLS<\/span> (y,x). <span style=\"color: #3366ff;\">fit<\/span> ()<\/strong><\/span><\/pre>\n<h3> <span style=\"color: #000000;\"><strong>Schritt 3: Kochentfernung berechnen<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Als n\u00e4chstes berechnen wir die Cook-Distanz f\u00fcr jede Beobachtung im Modell:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#suppress scientific notation\n<span style=\"color: #000000;\"><span style=\"color: #008000;\">import<\/span> numpy <span style=\"color: #008000;\">as<\/span> np\nn.p. <span style=\"color: #3366ff;\">set_printoptions<\/span> (suppress= <span style=\"color: #008000;\">True<\/span> )\n\n<span style=\"color: #008080;\">#create instance of influence\n<\/span>influence = model. <span style=\"color: #3366ff;\">get_influence<\/span> ()\n\n<span style=\"color: #008080;\">#obtain Cook's distance for each observation\n<\/span>cooks = influence. <span style=\"color: #3366ff;\">cooks_distance<\/span>\n\n<span style=\"color: #008080;\">#display Cook's distances\n<\/span><span style=\"color: #993300;\">print<\/span> (cooks)\n\n(array([0.368, 0.061, 0.001, 0.028, 0.105, 0.022, 0.017, 0. , 0.343,\n        0. , 0.15 , 0.349]),\n array([0.701, 0.941, 0.999, 0.973, 0.901, 0.979, 0.983, 1. , 0.718,\n        1. , 0.863, 0.713]))\n<\/span><\/span><\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Standardm\u00e4\u00dfig zeigt die Funktion <strong>\u201ecooks_distance()\u201c<\/strong> f\u00fcr jede Beobachtung ein Array von Werten f\u00fcr die Cook-Distanz an, gefolgt von einem Array entsprechender p-Werte.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Zum Beispiel:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Cook-Distanz f\u00fcr Beobachtung Nr. 1: <strong>0,368<\/strong> (p-Wert: 0,701)<\/span><\/li>\n<li> <span style=\"color: #000000;\">Cook-Distanz f\u00fcr Beobachtung Nr. 2: <strong>0,061<\/strong> (p-Wert: 0,941)<\/span><\/li>\n<li> <span style=\"color: #000000;\">Cook-Distanz f\u00fcr Beobachtung Nr. 3: <strong>0,001<\/strong> (p-Wert: 0,999)<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Und so weiter.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Schritt 4: Visualisieren Sie die Entfernungen des Kochs<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Schlie\u00dflich k\u00f6nnen wir ein Streudiagramm erstellen, um die Werte der Pr\u00e4diktorvariablen als Funktion der Cook-Distanz f\u00fcr jede Beobachtung zu visualisieren:<\/span> <\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\"><span style=\"color: #000000;\"><span style=\"color: #008000;\">import<\/span> matplotlib. <span style=\"color: #3366ff;\">pyplot<\/span> <span style=\"color: #008000;\">as<\/span> plt\n\nplt. <span style=\"color: #3366ff;\">scatter<\/span> (df.x, cooks[0])\nplt. <span style=\"color: #3366ff;\">xlabel<\/span> (' <span style=\"color: #008000;\">x<\/span> ')\nplt. <span style=\"color: #3366ff;\">ylabel<\/span> (' <span style=\"color: #008000;\">Cooks Distance<\/span> ')\nplt. <span style=\"color: #3366ff;\">show<\/span> ()<\/span><\/span><\/strong> <\/pre>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-12869 \" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/cuisinierspython1.png\" alt=\"Cooks Distanz in Python\" width=\"420\" height=\"284\" srcset=\"\" sizes=\"\"><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Abschlie\u00dfende Gedanken<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Es ist wichtig zu beachten, dass die Cook-Distanz verwendet werden sollte, um potenziell einflussreiche Beobachtungen <em>zu identifizieren<\/em> .<\/span> <span style=\"color: #000000;\">Nur weil eine Beobachtung einflussreich ist, hei\u00dft das nicht, dass sie aus dem Datensatz entfernt werden sollte.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Zun\u00e4chst m\u00fcssen Sie sicherstellen, dass die Beobachtung nicht auf einen Dateneingabefehler oder ein anderes seltsames Ereignis zur\u00fcckzuf\u00fchren ist. Wenn sich herausstellt, dass es sich um einen legitimen Wert handelt, k\u00f6nnen Sie entscheiden, ob es angemessen ist, ihn zu entfernen, ihn unver\u00e4ndert zu lassen oder ihn einfach durch einen alternativen Wert wie den Median zu ersetzen.<\/span><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Die Cook-Distanz wird verwendet, um einflussreiche Beobachtungen in einem Regressionsmodell zu identifizieren. Die Formel f\u00fcr die Cook-Distanz lautet: d i = (r i 2 \/ p*MSE) * (h ii \/ (1-h ii ) 2 ) Gold: r i ist der i -te Rest p ist die Anzahl der Koeffizienten im Regressionsmodell MSE ist der mittlere [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>So berechnen Sie die Cook-Distanz in Python<\/title>\n<meta name=\"description\" content=\"In diesem Tutorial wird anhand eines Beispiels erkl\u00e4rt, wie man die Cook-Distanz in Python berechnet.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/de\/kitchen-remote-python\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"So berechnen Sie die Cook-Distanz in Python\" \/>\n<meta property=\"og:description\" content=\"In diesem Tutorial wird anhand eines Beispiels erkl\u00e4rt, wie man die Cook-Distanz in Python berechnet.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/de\/kitchen-remote-python\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-26T22:01:06+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/cuisinierspython1.png\" \/>\n<meta name=\"author\" content=\"Dr. Benjamin Anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"Dr. Benjamin Anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"2 Minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/de\/kitchen-remote-python\/\",\"url\":\"https:\/\/statorials.org\/de\/kitchen-remote-python\/\",\"name\":\"So berechnen Sie die Cook-Distanz in Python\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/de\/#website\"},\"datePublished\":\"2023-07-26T22:01:06+00:00\",\"dateModified\":\"2023-07-26T22:01:06+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/de\/#\/schema\/person\/ec75c4d6365f2708f8a0ad3a42121aa0\"},\"description\":\"In diesem Tutorial wird anhand eines Beispiels erkl\u00e4rt, wie man die Cook-Distanz in Python berechnet.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/de\/kitchen-remote-python\/#breadcrumb\"},\"inLanguage\":\"de-DE\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/de\/kitchen-remote-python\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/de\/kitchen-remote-python\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Heim\",\"item\":\"https:\/\/statorials.org\/de\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"So berechnen sie die cook-distanz in python\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/de\/#website\",\"url\":\"https:\/\/statorials.org\/de\/\",\"name\":\"Statorials\",\"description\":\"Ihr Leitfaden f\u00fcr statistische Kompetenz !\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/de\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"de-DE\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/de\/#\/schema\/person\/ec75c4d6365f2708f8a0ad3a42121aa0\",\"name\":\"Dr. Benjamin Anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de-DE\",\"@id\":\"https:\/\/statorials.org\/de\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/statorials.org\/de\/wp-content\/uploads\/2023\/11\/Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"https:\/\/statorials.org\/de\/wp-content\/uploads\/2023\/11\/Benjamin-Anderson-96x96.jpg\",\"caption\":\"Dr. Benjamin Anderson\"},\"description\":\"Hallo, ich bin Benjamin, ein pensionierter Statistikprofessor, der sich zum engagierten Statorials-Lehrer entwickelt hat. Mit umfassender Erfahrung und Fachwissen auf dem Gebiet der Statistik bin ich bestrebt, mein Wissen zu teilen, um Studenten durch Statorials zu bef\u00e4higen. Mehr wissen\",\"sameAs\":[\"https:\/\/statorials.org\/de\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"So berechnen Sie die Cook-Distanz in Python","description":"In diesem Tutorial wird anhand eines Beispiels erkl\u00e4rt, wie man die Cook-Distanz in Python berechnet.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/de\/kitchen-remote-python\/","og_locale":"de_DE","og_type":"article","og_title":"So berechnen Sie die Cook-Distanz in Python","og_description":"In diesem Tutorial wird anhand eines Beispiels erkl\u00e4rt, wie man die Cook-Distanz in Python berechnet.","og_url":"https:\/\/statorials.org\/de\/kitchen-remote-python\/","og_site_name":"Statorials","article_published_time":"2023-07-26T22:01:06+00:00","og_image":[{"url":"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/cuisinierspython1.png"}],"author":"Dr. Benjamin Anderson","twitter_card":"summary_large_image","twitter_misc":{"Verfasst von":"Dr. Benjamin Anderson","Gesch\u00e4tzte Lesezeit":"2 Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/de\/kitchen-remote-python\/","url":"https:\/\/statorials.org\/de\/kitchen-remote-python\/","name":"So berechnen Sie die Cook-Distanz in Python","isPartOf":{"@id":"https:\/\/statorials.org\/de\/#website"},"datePublished":"2023-07-26T22:01:06+00:00","dateModified":"2023-07-26T22:01:06+00:00","author":{"@id":"https:\/\/statorials.org\/de\/#\/schema\/person\/ec75c4d6365f2708f8a0ad3a42121aa0"},"description":"In diesem Tutorial wird anhand eines Beispiels erkl\u00e4rt, wie man die Cook-Distanz in Python berechnet.","breadcrumb":{"@id":"https:\/\/statorials.org\/de\/kitchen-remote-python\/#breadcrumb"},"inLanguage":"de-DE","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/de\/kitchen-remote-python\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/de\/kitchen-remote-python\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Heim","item":"https:\/\/statorials.org\/de\/"},{"@type":"ListItem","position":2,"name":"So berechnen sie die cook-distanz in python"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/de\/#website","url":"https:\/\/statorials.org\/de\/","name":"Statorials","description":"Ihr Leitfaden f\u00fcr statistische Kompetenz !","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/de\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"de-DE"},{"@type":"Person","@id":"https:\/\/statorials.org\/de\/#\/schema\/person\/ec75c4d6365f2708f8a0ad3a42121aa0","name":"Dr. Benjamin Anderson","image":{"@type":"ImageObject","inLanguage":"de-DE","@id":"https:\/\/statorials.org\/de\/#\/schema\/person\/image\/","url":"https:\/\/statorials.org\/de\/wp-content\/uploads\/2023\/11\/Benjamin-Anderson-96x96.jpg","contentUrl":"https:\/\/statorials.org\/de\/wp-content\/uploads\/2023\/11\/Benjamin-Anderson-96x96.jpg","caption":"Dr. Benjamin Anderson"},"description":"Hallo, ich bin Benjamin, ein pensionierter Statistikprofessor, der sich zum engagierten Statorials-Lehrer entwickelt hat. Mit umfassender Erfahrung und Fachwissen auf dem Gebiet der Statistik bin ich bestrebt, mein Wissen zu teilen, um Studenten durch Statorials zu bef\u00e4higen. Mehr wissen","sameAs":["https:\/\/statorials.org\/de"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/posts\/1313"}],"collection":[{"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/comments?post=1313"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/posts\/1313\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/media?parent=1313"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/categories?post=1313"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/tags?post=1313"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}