{"id":1180,"date":"2023-07-27T09:18:03","date_gmt":"2023-07-27T09:18:03","guid":{"rendered":"https:\/\/statorials.org\/de\/auswahl-nach-stufen\/"},"modified":"2023-07-27T09:18:03","modified_gmt":"2023-07-27T09:18:03","slug":"auswahl-nach-stufen","status":"publish","type":"post","link":"https:\/\/statorials.org\/de\/auswahl-nach-stufen\/","title":{"rendered":"Was ist eine gestaffelte auswahl? (erkl\u00e4rung &amp; beispiele)"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\">Im Bereich des maschinellen Lernens besteht unser Ziel darin, ein Modell zu erstellen, das eine Reihe von Pr\u00e4diktorvariablen effektiv verwenden kann, um den Wert einer <a href=\"https:\/\/statorials.org\/de\/variablen-erklarende-antworten\/\" target=\"_blank\" rel=\"noopener noreferrer\">Antwortvariablen<\/a> vorherzusagen.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Bei einem Satz von insgesamt <em>p<\/em> Pr\u00e4diktorvariablen gibt es viele Modelle, die wir m\u00f6glicherweise erstellen k\u00f6nnten.<\/span> <span style=\"color: #000000;\">Eine Methode, mit der wir das beste Modell ausw\u00e4hlen k\u00f6nnen, ist die sogenannte <a href=\"https:\/\/statorials.org\/de\/beste-auswahl-an-teilmengen\/\" target=\"_blank\" rel=\"noopener noreferrer\">Auswahl der besten Teilmenge<\/a> . Dabei wird versucht, das beste Modell aus <em>allen<\/em> m\u00f6glichen Modellen auszuw\u00e4hlen, die mit dem Satz von Pr\u00e4diktoren erstellt werden k\u00f6nnten.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Leider hat diese Methode zwei Nachteile:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Dies kann rechenintensiv sein. F\u00fcr einen Satz von <em>p<\/em> Pr\u00e4diktorvariablen gibt es 2 <sup>p<\/sup> m\u00f6gliche Modelle. Bei 10 Pr\u00e4diktorvariablen sind beispielsweise 2 <sup>\u00b7 10<\/sup> = 1000 m\u00f6gliche Modelle zu ber\u00fccksichtigen.<\/span><\/li>\n<li> <span style=\"color: #000000;\">Da eine sehr gro\u00dfe Anzahl von Modellen ber\u00fccksichtigt wird, k\u00f6nnte m\u00f6glicherweise ein Modell gefunden werden, das bei Trainingsdaten eine gute Leistung erbringt, bei zuk\u00fcnftigen Daten jedoch nicht. Dies k\u00f6nnte <a href=\"https:\/\/statorials.org\/de\/uberanpassung-des-maschinellen-lernens\/\" target=\"_blank\" rel=\"noopener noreferrer\">zu einer \u00dcberanpassung<\/a> f\u00fchren.<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Eine Alternative zur Auswahl der besten Teilmenge ist die sogenannte <strong>schrittweise Auswahl<\/strong> , bei der eine viel kleinere Menge von Modellen verglichen wird.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Es gibt zwei Arten von Schrittauswahlmethoden: Vorw\u00e4rtsschrittauswahl und R\u00fcckw\u00e4rtsschrittauswahl.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Schritt f\u00fcr Schritt vorw\u00e4rts Auswahl<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Die schrittweise Vorw\u00e4rtsauswahl funktioniert wie folgt:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>1.<\/strong> Sei M <sub>0<\/sub> das Nullmodell, das keine Vorhersagevariable enth\u00e4lt.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>2.<\/strong> F\u00fcr k = 0, 2, \u2026 p-1:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Passen Sie alle pk-Modelle an, die die Pr\u00e4diktoren in M <sub>k<\/sub> erh\u00f6hen, mit einer zus\u00e4tzlichen Pr\u00e4diktorvariablen.<\/span><\/li>\n<li> <span style=\"color: #000000;\">W\u00e4hlen Sie unter diesen pk-Modellen das beste aus und nennen Sie es M <sub>k+1<\/sub> . Definieren Sie \u201eam besten\u201c als das Modell mit dem h\u00f6chsten R <sup>2<\/sup> oder, entsprechend, dem niedrigsten RSS.<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\"><strong>3.<\/strong> W\u00e4hlen Sie ein einzelnes bestes Modell aus M <sub>0<\/sub> \u2026 M <sub>p<\/sub> unter Verwendung des Kreuzvalidierungs-Vorhersagefehlers, Cp, BIC, AIC oder des angepassten R <sup>2<\/sup> aus.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Schrittweise R\u00fcckw\u00e4rtsauswahl<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Die R\u00fcckw\u00e4rtsschrittauswahl funktioniert wie folgt:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>1.<\/strong> Sei M <sub>p<\/sub> das vollst\u00e4ndige Modell, das alle <em>p<\/em> Vorhersagevariablen enth\u00e4lt.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>2.<\/strong> F\u00fcr k = p, p-1, \u2026 1:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Passen Sie alle k Modelle an, die alle bis auf einen Pr\u00e4diktor in <sub>Mk<\/sub> enthalten, f\u00fcr insgesamt k-1 Pr\u00e4diktorvariablen.<\/span><\/li>\n<li> <span style=\"color: #000000;\">W\u00e4hlen Sie aus diesen k Modellen das beste aus und nennen Sie es M <sub>k-1<\/sub> . Definieren Sie \u201eam besten\u201c als das Modell mit dem h\u00f6chsten R <sup>2<\/sup> oder, entsprechend, dem niedrigsten RSS.<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\"><strong>3.<\/strong> W\u00e4hlen Sie ein einzelnes bestes Modell aus M <sub>0<\/sub> \u2026 M <sub>p<\/sub> unter Verwendung des Kreuzvalidierungs-Vorhersagefehlers, Cp, BIC, AIC oder des angepassten R <sup>2<\/sup> aus.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Kriterien zur Auswahl des \u201ebesten\u201c Modells<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Der letzte Schritt der schrittweisen Vorw\u00e4rts- und R\u00fcckw\u00e4rtsauswahl besteht darin, das Modell mit dem niedrigsten Vorhersagefehler, dem niedrigsten Cp, dem niedrigsten BIC, dem h\u00f6chsten AIC-Tief oder dem h\u00f6chsten angepassten R <sup>2<\/sup> auszuw\u00e4hlen.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Hier sind die Formeln, die zur Berechnung jeder dieser Metriken verwendet werden:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Cp:<\/strong> (RSS+2d\u03c3\u0302) \/ n<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>AIC:<\/strong> (RSS+2d\u03c3\u0302 <sup>2<\/sup> ) \/ (n\u03c3\u0302 <sup>2<\/sup> )<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>BIC:<\/strong> (RSS+log(n)d\u03c3\u0302 <sup>2<\/sup> ) \/ n<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>R <sup>2<\/sup> angepasst:<\/strong> 1 \u2013 ( (RSS \/ (nd-1)) \/ (TSS \/ (n-1)) )<\/span><\/p>\n<p> <span style=\"color: #000000;\">Gold:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\"><strong>d:<\/strong> Die Anzahl der Pr\u00e4diktoren<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>n:<\/strong> Gesamtbeobachtungen<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>\u03c3\u0302:<\/strong> Sch\u00e4tzung der Fehlervarianz, die jedem Antwortma\u00df in einem Regressionsmodell zugeordnet ist<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>RSS:<\/strong> Residualsumme der Quadrate aus dem Regressionsmodell<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>TSS:<\/strong> Gesamtsumme der Quadrate des Regressionsmodells<\/span><\/li>\n<\/ul>\n<h3> <span style=\"color: #000000;\"><strong>Vor- und Nachteile der stufenweisen Auswahl<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Die gestaffelte Selektion bietet folgende <strong>Vorteile<\/strong> :<\/span><\/p>\n<p> <span style=\"color: #000000;\">Diese Methode ist recheneffizienter als die Auswahl der besten Teilmenge. Bei <em>p-<\/em> Pr\u00e4diktorvariablen muss die Auswahl der besten Teilmenge 2- <sup>p<\/sup> -Modellen entsprechen.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Umgekehrt sollte die schrittweise Auswahl nur f\u00fcr 1+p(p+ 1)\/2-Modelle geeignet sein. F\u00fcr p = 10 Pr\u00e4diktorvariablen sollte die beste Teilmengenauswahl f\u00fcr 1.000 Modelle geeignet sein, w\u00e4hrend die schrittweise Auswahl nur f\u00fcr 56 Modelle geeignet sein sollte.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Die abgestufte Auswahl hat jedoch den <strong>folgenden potenziellen Nachteil:<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Es kann nicht garantiert werden, dass unter allen potenziellen <sup>2p-<\/sup> Modellen das bestm\u00f6gliche Modell gefunden wird.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Angenommen, wir haben einen Datensatz mit p = 3 Pr\u00e4diktoren. Das bestm\u00f6gliche Modell mit einem Pr\u00e4diktor kann x <sub>1<\/sub> enthalten, und das bestm\u00f6gliche Modell mit zwei Pr\u00e4diktoren kann stattdessen x <sub>1<\/sub> und x <sub>2<\/sub> enthalten.<\/span><\/p>\n<p> <span style=\"color: #000000;\">In diesem Fall gelingt es der schrittweisen Vorw\u00e4rtsauswahl nicht, das bestm\u00f6gliche Modell mit zwei Pr\u00e4diktoren auszuw\u00e4hlen, da M <sub>1<\/sub> x <sub>1<\/sub> enth\u00e4lt und M <sub>2<\/sub> daher auch x <sub>1<\/sub> sowie eine andere Variable enthalten muss.<\/span><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Im Bereich des maschinellen Lernens besteht unser Ziel darin, ein Modell zu erstellen, das eine Reihe von Pr\u00e4diktorvariablen effektiv verwenden kann, um den Wert einer Antwortvariablen vorherzusagen. Bei einem Satz von insgesamt p Pr\u00e4diktorvariablen gibt es viele Modelle, die wir m\u00f6glicherweise erstellen k\u00f6nnten. Eine Methode, mit der wir das beste Modell ausw\u00e4hlen k\u00f6nnen, ist die [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Was ist eine gestaffelte Auswahl? (Erkl\u00e4rung und Beispiele)<\/title>\n<meta name=\"description\" content=\"In diesem Tutorial wird die Modellauswahl anhand eines Beispiels Schritt f\u00fcr Schritt erkl\u00e4rt.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/de\/auswahl-nach-stufen\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Was ist eine gestaffelte Auswahl? (Erkl\u00e4rung und Beispiele)\" \/>\n<meta property=\"og:description\" content=\"In diesem Tutorial wird die Modellauswahl anhand eines Beispiels Schritt f\u00fcr Schritt erkl\u00e4rt.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/de\/auswahl-nach-stufen\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-27T09:18:03+00:00\" \/>\n<meta name=\"author\" content=\"Dr. Benjamin Anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"Dr. Benjamin Anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"3 Minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/de\/auswahl-nach-stufen\/\",\"url\":\"https:\/\/statorials.org\/de\/auswahl-nach-stufen\/\",\"name\":\"Was ist eine gestaffelte Auswahl? (Erkl\u00e4rung und Beispiele)\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/de\/#website\"},\"datePublished\":\"2023-07-27T09:18:03+00:00\",\"dateModified\":\"2023-07-27T09:18:03+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/de\/#\/schema\/person\/ec75c4d6365f2708f8a0ad3a42121aa0\"},\"description\":\"In diesem Tutorial wird die Modellauswahl anhand eines Beispiels Schritt f\u00fcr Schritt erkl\u00e4rt.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/de\/auswahl-nach-stufen\/#breadcrumb\"},\"inLanguage\":\"de-DE\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/de\/auswahl-nach-stufen\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/de\/auswahl-nach-stufen\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Heim\",\"item\":\"https:\/\/statorials.org\/de\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Was ist eine gestaffelte auswahl? (erkl\u00e4rung &amp; beispiele)\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/de\/#website\",\"url\":\"https:\/\/statorials.org\/de\/\",\"name\":\"Statorials\",\"description\":\"Ihr Leitfaden f\u00fcr statistische Kompetenz !\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/de\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"de-DE\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/de\/#\/schema\/person\/ec75c4d6365f2708f8a0ad3a42121aa0\",\"name\":\"Dr. Benjamin Anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de-DE\",\"@id\":\"https:\/\/statorials.org\/de\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/statorials.org\/de\/wp-content\/uploads\/2023\/11\/Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"https:\/\/statorials.org\/de\/wp-content\/uploads\/2023\/11\/Benjamin-Anderson-96x96.jpg\",\"caption\":\"Dr. Benjamin Anderson\"},\"description\":\"Hallo, ich bin Benjamin, ein pensionierter Statistikprofessor, der sich zum engagierten Statorials-Lehrer entwickelt hat. Mit umfassender Erfahrung und Fachwissen auf dem Gebiet der Statistik bin ich bestrebt, mein Wissen zu teilen, um Studenten durch Statorials zu bef\u00e4higen. Mehr wissen\",\"sameAs\":[\"https:\/\/statorials.org\/de\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Was ist eine gestaffelte Auswahl? (Erkl\u00e4rung und Beispiele)","description":"In diesem Tutorial wird die Modellauswahl anhand eines Beispiels Schritt f\u00fcr Schritt erkl\u00e4rt.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/de\/auswahl-nach-stufen\/","og_locale":"de_DE","og_type":"article","og_title":"Was ist eine gestaffelte Auswahl? (Erkl\u00e4rung und Beispiele)","og_description":"In diesem Tutorial wird die Modellauswahl anhand eines Beispiels Schritt f\u00fcr Schritt erkl\u00e4rt.","og_url":"https:\/\/statorials.org\/de\/auswahl-nach-stufen\/","og_site_name":"Statorials","article_published_time":"2023-07-27T09:18:03+00:00","author":"Dr. Benjamin Anderson","twitter_card":"summary_large_image","twitter_misc":{"Verfasst von":"Dr. Benjamin Anderson","Gesch\u00e4tzte Lesezeit":"3 Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/de\/auswahl-nach-stufen\/","url":"https:\/\/statorials.org\/de\/auswahl-nach-stufen\/","name":"Was ist eine gestaffelte Auswahl? (Erkl\u00e4rung und Beispiele)","isPartOf":{"@id":"https:\/\/statorials.org\/de\/#website"},"datePublished":"2023-07-27T09:18:03+00:00","dateModified":"2023-07-27T09:18:03+00:00","author":{"@id":"https:\/\/statorials.org\/de\/#\/schema\/person\/ec75c4d6365f2708f8a0ad3a42121aa0"},"description":"In diesem Tutorial wird die Modellauswahl anhand eines Beispiels Schritt f\u00fcr Schritt erkl\u00e4rt.","breadcrumb":{"@id":"https:\/\/statorials.org\/de\/auswahl-nach-stufen\/#breadcrumb"},"inLanguage":"de-DE","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/de\/auswahl-nach-stufen\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/de\/auswahl-nach-stufen\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Heim","item":"https:\/\/statorials.org\/de\/"},{"@type":"ListItem","position":2,"name":"Was ist eine gestaffelte auswahl? (erkl\u00e4rung &amp; beispiele)"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/de\/#website","url":"https:\/\/statorials.org\/de\/","name":"Statorials","description":"Ihr Leitfaden f\u00fcr statistische Kompetenz !","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/de\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"de-DE"},{"@type":"Person","@id":"https:\/\/statorials.org\/de\/#\/schema\/person\/ec75c4d6365f2708f8a0ad3a42121aa0","name":"Dr. Benjamin Anderson","image":{"@type":"ImageObject","inLanguage":"de-DE","@id":"https:\/\/statorials.org\/de\/#\/schema\/person\/image\/","url":"https:\/\/statorials.org\/de\/wp-content\/uploads\/2023\/11\/Benjamin-Anderson-96x96.jpg","contentUrl":"https:\/\/statorials.org\/de\/wp-content\/uploads\/2023\/11\/Benjamin-Anderson-96x96.jpg","caption":"Dr. Benjamin Anderson"},"description":"Hallo, ich bin Benjamin, ein pensionierter Statistikprofessor, der sich zum engagierten Statorials-Lehrer entwickelt hat. Mit umfassender Erfahrung und Fachwissen auf dem Gebiet der Statistik bin ich bestrebt, mein Wissen zu teilen, um Studenten durch Statorials zu bef\u00e4higen. Mehr wissen","sameAs":["https:\/\/statorials.org\/de"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/posts\/1180"}],"collection":[{"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/comments?post=1180"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/posts\/1180\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/media?parent=1180"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/categories?post=1180"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/tags?post=1180"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}