{"id":1404,"date":"2023-07-26T12:37:50","date_gmt":"2023-07-26T12:37:50","guid":{"rendered":"https:\/\/statorials.org\/de\/dummy-variablen-in-r\/"},"modified":"2023-07-26T12:37:50","modified_gmt":"2023-07-26T12:37:50","slug":"dummy-variablen-in-r","status":"publish","type":"post","link":"https:\/\/statorials.org\/de\/dummy-variablen-in-r\/","title":{"rendered":"So erstellen sie dummy-variablen in r (schritt f\u00fcr schritt)"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\">Eine <a href=\"https:\/\/statorials.org\/de\/regressions-dummy-variablen\/\" target=\"_blank\" rel=\"noopener\">Dummy-Variable<\/a> ist ein Variablentyp, den wir in der Regressionsanalyse erstellen, damit wir eine kategoriale Variable als numerische Variable darstellen k\u00f6nnen, die einen von zwei Werten annimmt: Null oder Eins.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Angenommen, wir haben den folgenden Datensatz und m\u00f6chten <em>Alter<\/em> und <em>Familienstand<\/em> verwenden, um <em>das Einkommen<\/em> vorherzusagen:<\/span> <\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-13944 \" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/mannequin4.png\" alt=\"\" width=\"246\" height=\"309\" srcset=\"\" sizes=\"\"><\/p>\n<p> <span style=\"color: #000000;\">Um <em>den Familienstand<\/em> als Pr\u00e4diktorvariable in einem Regressionsmodell zu verwenden, m\u00fcssen wir ihn in eine Dummy-Variable umwandeln.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Da es sich derzeit um eine kategoriale Variable handelt, die drei verschiedene Werte annehmen kann (\u201eSingle\u201c, \u201eVerheiratet\u201c oder \u201eGeschieden\u201c), m\u00fcssen wir <em>k<\/em> -1 = 3-1 = 2 Dummy-Variablen erstellen.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Um diese Dummy-Variable zu erstellen, k\u00f6nnen wir \u201eSingle\u201c als Basiswert belassen, da diese am h\u00e4ufigsten vorkommt. So w\u00fcrden wir <em>den Familienstand<\/em> in Dummy-Variablen umwandeln:<\/span> <\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-13950 \" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/mannequin6.png\" alt=\"\" width=\"615\" height=\"311\" srcset=\"\" sizes=\"\"><\/p>\n<p> <span style=\"color: #000000;\">Dieses Tutorial bietet ein schrittweises Beispiel f\u00fcr die Erstellung von Dummy-Variablen f\u00fcr genau diesen Datensatz in R und die anschlie\u00dfende Durchf\u00fchrung einer Regressionsanalyse unter Verwendung dieser Dummy-Variablen als Pr\u00e4diktoren.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Schritt 1: Erstellen Sie die Daten<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Erstellen wir zun\u00e4chst den Datensatz in R:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#create data frame<\/span>\ndf &lt;- data. <span style=\"color: #3366ff;\">frame<\/span> (income=c(45000, 48000, 54000, 57000, 65000, 69000,\n                          78000, 83000, 98000, 104000, 107000),\n                 age=c(23, 25, 24, 29, 38, 36, 40, 59, 56, 64, 53),\n                 status=c('Single', 'Single', 'Single', 'Single',\n                          'Married', 'Single', 'Married', 'Divorced',\n                          'Divorced', 'Married', 'Married'))\n\n<span style=\"color: #008080;\">#view data frame\n<\/span>df\n\n   income age status\n1 45000 23 Single\n2 48000 25 Single\n3 54000 24 Single\n4 57000 29 Single\n5 65000 38 Married\n6 69000 36 Single\n7 78000 40 Married\n8 83000 59 Divorced\n9 98000 56 Divorced\n10 104000 64 Married\n11 107000 53 Married<\/strong><\/pre>\n<h3> <span style=\"color: #000000;\"><strong>Schritt 2: Erstellen Sie die Dummy-Variablen<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Als n\u00e4chstes k\u00f6nnen wir die Funktion <strong>ifelse()<\/strong> in R verwenden, um Dummy-Variablen zu definieren und dann den endg\u00fcltigen Datenrahmen definieren, den wir zum Aufbau des Regressionsmodells verwenden m\u00f6chten:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#create dummy variables<\/span>\nmarried &lt;- <span style=\"color: #3366ff;\">ifelse<\/span> (df$status <span style=\"color: #993300;\">==<\/span> ' <span style=\"color: #008000;\">Married<\/span> ', 1, 0)\ndivorced &lt;- <span style=\"color: #3366ff;\">ifelse<\/span> (df$status <span style=\"color: #993300;\">==<\/span> ' <span style=\"color: #008000;\">Divorced<\/span> ', 1, 0)\n\n<span style=\"color: #008080;\">#create data frame to use for regression\n<\/span>df_reg &lt;- data. <span style=\"color: #3366ff;\">frame<\/span> (income = df$income,\n                     age = df$age,\n                     married = married,\n                     divorced = divorced)\n\n<span style=\"color: #008080;\">#view data frame\n<\/span>df_reg\n\n   income age married divorced\n1 45000 23 0 0\n2 48000 25 0 0\n3 54000 24 0 0\n4 57000 29 0 0\n5 65000 38 1 0\n6 69000 36 0 0\n7 78000 40 1 0\n8 83000 59 0 1\n9 98000 56 0 1\n10 104000 64 1 0\n11 107000 53 1 0\n<\/strong><\/pre>\n<h3> <span style=\"color: #000000;\"><strong>Schritt 3: F\u00fchren Sie eine lineare Regression durch<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Schlie\u00dflich k\u00f6nnen wir die Funktion <strong>lm()<\/strong> verwenden, um ein multiples lineares Regressionsmodell anzupassen:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#create regression model\n<\/span>model &lt;- <span style=\"color: #3366ff;\">lm<\/span> (income ~ age + married + divorced, data=df_reg)\n\n<span style=\"color: #008080;\">#view regression model output\n<\/span>summary(model)\n\nCall:\nlm(formula = income ~ age + married + divorced, data = df_reg)\n\nResiduals:\n    Min 1Q Median 3Q Max \n-9707.5 -5033.8 45.3 3390.4 12245.4 \n\nCoefficients:\n            Estimate Std. Error t value Pr(&gt;|t|)   \n(Intercept) 14276.1 10411.5 1.371 0.21266   \nage 1471.7 354.4 4.152 0.00428 **\nmarried 2479.7 9431.3 0.263 0.80018   \ndivorced -8397.4 12771.4 -0.658 0.53187   \n---\nSignificant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1\n\nResidual standard error: 8391 on 7 degrees of freedom\nMultiple R-squared: 0.9008, Adjusted R-squared: 0.8584 \nF-statistic: 21.2 on 3 and 7 DF, p-value: 0.0006865\n<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Die angepasste Regressionsgerade sieht wie folgt aus:<\/span><\/p>\n<p> <span style=\"color: #000000;\">Einkommen = 14.276,1 + 1.471,7*(Alter) + 2.479,7*(verheiratet) \u2013 8.397,4*(geschieden)<\/span><\/p>\n<p> <span style=\"color: #000000;\">Mit dieser Gleichung k\u00f6nnen wir das gesch\u00e4tzte Einkommen einer Person basierend auf ihrem Alter und Familienstand ermitteln. Beispielsweise h\u00e4tte eine verheiratete Person im Alter von 35 Jahren ein gesch\u00e4tztes Einkommen von <strong>68.264 US-Dollar<\/strong> :<\/span><\/p>\n<p> <span style=\"color: #000000;\">Einkommen = 14.276,2 + 1.471,7*(35) + 2.479,7*(1) \u2013 8.397,4*(0) = 68.264 $<\/span><\/p>\n<p> <span style=\"color: #000000;\">So interpretieren Sie die Regressionskoeffizienten in der Tabelle:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\"><strong>Schnittpunkt:<\/strong> Der Schnittpunkt stellt das durchschnittliche Einkommen einer einzelnen Person im Alter von null Jahren dar. Offensichtlich kann es keine Nulljahre geben, daher macht es keinen Sinn, den Achsenabschnitt allein in diesem speziellen Regressionsmodell zu interpretieren.<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>Alter:<\/strong> Jedes Jahr steigenden Lebensalters ist mit einem durchschnittlichen Anstieg des Einkommens um 1.471,70 US-Dollar verbunden. Da der p-Wert (0,004) kleiner als 0,05 ist, ist das Alter ein statistisch signifikanter Pr\u00e4diktor f\u00fcr das Einkommen.<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>Verheiratet:<\/strong> Eine verheiratete Person verdient im Durchschnitt 2.479,70 $ mehr als eine alleinstehende Person. Da der p-Wert (0,800) nicht kleiner als 0,05 ist, ist dieser Unterschied statistisch nicht signifikant.<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>Geschieden:<\/strong> Eine geschiedene Person verdient im Durchschnitt 8.397,40 $ weniger als eine alleinstehende Person. Da der p-Wert (0,532) nicht kleiner als 0,05 ist, ist dieser Unterschied statistisch nicht signifikant.<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Da beide Dummy-Variablen statistisch nicht signifikant waren, konnten wir <em>den Familienstand<\/em> als Pr\u00e4diktor aus dem Modell entfernen, da er offenbar keinen pr\u00e4diktiven Wert f\u00fcr das Einkommen bietet.<\/span><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Eine Dummy-Variable ist ein Variablentyp, den wir in der Regressionsanalyse erstellen, damit wir eine kategoriale Variable als numerische Variable darstellen k\u00f6nnen, die einen von zwei Werten annimmt: Null oder Eins. Angenommen, wir haben den folgenden Datensatz und m\u00f6chten Alter und Familienstand verwenden, um das Einkommen vorherzusagen: Um den Familienstand als Pr\u00e4diktorvariable in einem Regressionsmodell zu [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>So erstellen Sie Dummy-Variablen in R (Schritt f\u00fcr Schritt)<\/title>\n<meta name=\"description\" content=\"Dieses Tutorial erkl\u00e4rt, wie man Dummy-Variablen in R erstellt, einschlie\u00dflich eines Schritt-f\u00fcr-Schritt-Beispiels.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/de\/dummy-variablen-in-r\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"So erstellen Sie Dummy-Variablen in R (Schritt f\u00fcr Schritt)\" \/>\n<meta property=\"og:description\" content=\"Dieses Tutorial erkl\u00e4rt, wie man Dummy-Variablen in R erstellt, einschlie\u00dflich eines Schritt-f\u00fcr-Schritt-Beispiels.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/de\/dummy-variablen-in-r\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-26T12:37:50+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/mannequin4.png\" \/>\n<meta name=\"author\" content=\"Dr. Benjamin Anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"Dr. Benjamin Anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"3 Minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/de\/dummy-variablen-in-r\/\",\"url\":\"https:\/\/statorials.org\/de\/dummy-variablen-in-r\/\",\"name\":\"So erstellen Sie Dummy-Variablen in R (Schritt f\u00fcr Schritt)\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/de\/#website\"},\"datePublished\":\"2023-07-26T12:37:50+00:00\",\"dateModified\":\"2023-07-26T12:37:50+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/de\/#\/schema\/person\/ec75c4d6365f2708f8a0ad3a42121aa0\"},\"description\":\"Dieses Tutorial erkl\u00e4rt, wie man Dummy-Variablen in R erstellt, einschlie\u00dflich eines Schritt-f\u00fcr-Schritt-Beispiels.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/de\/dummy-variablen-in-r\/#breadcrumb\"},\"inLanguage\":\"de-DE\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/de\/dummy-variablen-in-r\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/de\/dummy-variablen-in-r\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Heim\",\"item\":\"https:\/\/statorials.org\/de\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"So erstellen sie dummy-variablen in r (schritt f\u00fcr schritt)\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/de\/#website\",\"url\":\"https:\/\/statorials.org\/de\/\",\"name\":\"Statorials\",\"description\":\"Ihr Leitfaden f\u00fcr statistische Kompetenz !\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/de\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"de-DE\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/de\/#\/schema\/person\/ec75c4d6365f2708f8a0ad3a42121aa0\",\"name\":\"Dr. Benjamin Anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de-DE\",\"@id\":\"https:\/\/statorials.org\/de\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/statorials.org\/de\/wp-content\/uploads\/2023\/11\/Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"https:\/\/statorials.org\/de\/wp-content\/uploads\/2023\/11\/Benjamin-Anderson-96x96.jpg\",\"caption\":\"Dr. Benjamin Anderson\"},\"description\":\"Hallo, ich bin Benjamin, ein pensionierter Statistikprofessor, der sich zum engagierten Statorials-Lehrer entwickelt hat. Mit umfassender Erfahrung und Fachwissen auf dem Gebiet der Statistik bin ich bestrebt, mein Wissen zu teilen, um Studenten durch Statorials zu bef\u00e4higen. Mehr wissen\",\"sameAs\":[\"https:\/\/statorials.org\/de\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"So erstellen Sie Dummy-Variablen in R (Schritt f\u00fcr Schritt)","description":"Dieses Tutorial erkl\u00e4rt, wie man Dummy-Variablen in R erstellt, einschlie\u00dflich eines Schritt-f\u00fcr-Schritt-Beispiels.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/de\/dummy-variablen-in-r\/","og_locale":"de_DE","og_type":"article","og_title":"So erstellen Sie Dummy-Variablen in R (Schritt f\u00fcr Schritt)","og_description":"Dieses Tutorial erkl\u00e4rt, wie man Dummy-Variablen in R erstellt, einschlie\u00dflich eines Schritt-f\u00fcr-Schritt-Beispiels.","og_url":"https:\/\/statorials.org\/de\/dummy-variablen-in-r\/","og_site_name":"Statorials","article_published_time":"2023-07-26T12:37:50+00:00","og_image":[{"url":"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/mannequin4.png"}],"author":"Dr. Benjamin Anderson","twitter_card":"summary_large_image","twitter_misc":{"Verfasst von":"Dr. Benjamin Anderson","Gesch\u00e4tzte Lesezeit":"3 Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/de\/dummy-variablen-in-r\/","url":"https:\/\/statorials.org\/de\/dummy-variablen-in-r\/","name":"So erstellen Sie Dummy-Variablen in R (Schritt f\u00fcr Schritt)","isPartOf":{"@id":"https:\/\/statorials.org\/de\/#website"},"datePublished":"2023-07-26T12:37:50+00:00","dateModified":"2023-07-26T12:37:50+00:00","author":{"@id":"https:\/\/statorials.org\/de\/#\/schema\/person\/ec75c4d6365f2708f8a0ad3a42121aa0"},"description":"Dieses Tutorial erkl\u00e4rt, wie man Dummy-Variablen in R erstellt, einschlie\u00dflich eines Schritt-f\u00fcr-Schritt-Beispiels.","breadcrumb":{"@id":"https:\/\/statorials.org\/de\/dummy-variablen-in-r\/#breadcrumb"},"inLanguage":"de-DE","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/de\/dummy-variablen-in-r\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/de\/dummy-variablen-in-r\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Heim","item":"https:\/\/statorials.org\/de\/"},{"@type":"ListItem","position":2,"name":"So erstellen sie dummy-variablen in r (schritt f\u00fcr schritt)"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/de\/#website","url":"https:\/\/statorials.org\/de\/","name":"Statorials","description":"Ihr Leitfaden f\u00fcr statistische Kompetenz !","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/de\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"de-DE"},{"@type":"Person","@id":"https:\/\/statorials.org\/de\/#\/schema\/person\/ec75c4d6365f2708f8a0ad3a42121aa0","name":"Dr. Benjamin Anderson","image":{"@type":"ImageObject","inLanguage":"de-DE","@id":"https:\/\/statorials.org\/de\/#\/schema\/person\/image\/","url":"https:\/\/statorials.org\/de\/wp-content\/uploads\/2023\/11\/Benjamin-Anderson-96x96.jpg","contentUrl":"https:\/\/statorials.org\/de\/wp-content\/uploads\/2023\/11\/Benjamin-Anderson-96x96.jpg","caption":"Dr. Benjamin Anderson"},"description":"Hallo, ich bin Benjamin, ein pensionierter Statistikprofessor, der sich zum engagierten Statorials-Lehrer entwickelt hat. Mit umfassender Erfahrung und Fachwissen auf dem Gebiet der Statistik bin ich bestrebt, mein Wissen zu teilen, um Studenten durch Statorials zu bef\u00e4higen. Mehr wissen","sameAs":["https:\/\/statorials.org\/de"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/posts\/1404"}],"collection":[{"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/comments?post=1404"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/posts\/1404\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/media?parent=1404"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/categories?post=1404"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/tags?post=1404"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}