{"id":1276,"date":"2023-07-27T01:24:14","date_gmt":"2023-07-27T01:24:14","guid":{"rendered":"https:\/\/statorials.org\/nl\/dfbetas-in-r\/"},"modified":"2023-07-27T01:24:14","modified_gmt":"2023-07-27T01:24:14","slug":"dfbetas-in-r","status":"publish","type":"post","link":"https:\/\/statorials.org\/nl\/dfbetas-in-r\/","title":{"rendered":"Hoe dfbetas in r te berekenen"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\">In de statistiek willen we vaak weten welke invloed verschillende <a href=\"https:\/\/statorials.org\/nl\/observatie-in-de-statistiek\/\" target=\"_blank\" rel=\"noopener\">observaties<\/a> hebben op regressiemodellen.<\/span><\/p>\n<p> <span style=\"color: #000000;\">E\u00e9n manier om de invloed van waarnemingen te berekenen is door een metriek te gebruiken die bekend staat als <strong>DFBETAS<\/strong> , die ons het gestandaardiseerde effect op elke co\u00ebffici\u00ebnt vertelt van het verwijderen van elke individuele waarneming.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Deze metriek geeft ons een idee van de invloed van elke waarneming op elke co\u00ebffici\u00ebntschatting in een bepaald regressiemodel.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Deze tutorial toont een stapsgewijs voorbeeld van hoe u DFBETAS voor elke waarneming in een model in R kunt berekenen en visualiseren.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Stap 1: Maak een regressiemodel<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Eerst zullen we een <a href=\"https:\/\/statorials.org\/nl\/meervoudige-lineaire-regressie-r\/\" target=\"_blank\" rel=\"noopener\">meervoudig lineair regressiemodel<\/a> maken met behulp van de <strong>mtcars-<\/strong> dataset die in R is ingebouwd:<\/span><\/p>\n<pre style=\"background-color: #e5e5e5; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#fit a regression model<\/span>\nmodel &lt;- lm(mpg~disp+hp, data=mtcars)\n\n<span style=\"color: #008080;\">#view model summary\n<\/span>summary(model)\n\nCoefficients:\n             Estimate Std. Error t value Pr(&gt;|t|)    \n(Intercept) 30.735904 1.331566 23.083 &lt; 2nd-16 ***\navailable -0.030346 0.007405 -4.098 0.000306 ***\nhp -0.024840 0.013385 -1.856 0.073679 .  \n---\nSignificant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1\n\nResidual standard error: 3.127 on 29 degrees of freedom\nMultiple R-squared: 0.7482, Adjusted R-squared: 0.7309 \nF-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09\n<\/strong><\/pre>\n<h3> <span style=\"color: #000000;\"><strong>Stap 2: Bereken DFBETAS voor elke waarneming<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Vervolgens zullen we de ingebouwde functie <strong>dfbetas()<\/strong> gebruiken om de DFBETAS-waarden voor elke waarneming in het model te berekenen:<\/span><\/p>\n<pre style=\"background-color: #e5e5e5; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#calculate DFBETAS for each observation in the model\n<\/span>dfbetas &lt;- <span style=\"color: #3366ff;\">as<\/span> . <span style=\"color: #3366ff;\">data<\/span> . <span style=\"color: #3366ff;\">frame<\/span> (dfbetas(model))\n\n<span style=\"color: #008080;\">#display DFBETAS for each observation\n<\/span>dfbetas\n\n                      (Intercept) disp hp\nMazda RX4 -0.1174171253 0.030760632 1.748143e-02\nMazda RX4 Wag -0.1174171253 0.030760632 1.748143e-02\nDatsun 710 -0.1694989349 0.086630144 -3.332781e-05\nHornet 4 Drive 0.0577309674 0.078971334 -8.705488e-02\nHornet Sportabout -0.0204333878 0.237526523 -1.366155e-01\nValiant -0.1711908285 -0.139135639 1.829038e-01\nDuster 360 -0.0312338677 -0.005356209 3.581378e-02\nMerc 240D -0.0312259577 -0.010409922 2.433256e-02\nMerc 230 -0.0865872595 0.016428917 2.287867e-02\nMerc 280 -0.1560683502 0.078667906 -1.911180e-02\nMerc 280C -0.2254489597 0.113639937 -2.760800e-02\nMerc 450SE 0.0022844093 0.002966155 -2.855985e-02\nMerc 450SL 0.0009062022 0.001176644 -1.132941e-02\nMerc 450SLC 0.0041566755 0.005397169 -5.196706e-02\nCadillac Fleetwood 0.0388832216 -0.134511133 7.277283e-02\nLincoln Continental 0.0483781688 -0.121146607 5.326220e-02\nChrysler Imperial -0.1645266331 0.236634429 -3.917771e-02\nFiat 128 0.5720358325 -0.181104179 -1.265475e-01\nHonda Civic 0.3490872162 -0.053660545 -1.326422e-01\nToyota Corolla 0.7367058819 -0.268512348 -1.342384e-01\nToyota Corona -0.2181110386 0.101336902 5.945352e-03\nDodge Challenger -0.0270169005 -0.123610713 9.441241e-02\nAMC Javelin -0.0406785103 -0.141711468 1.074514e-01\nCamaro Z28 0.0390139262 0.012846225 -5.031588e-02\nPontiac Firebird -0.0549059340 0.574544346 -3.689584e-01\nFiat X1-9 0.0565157245 -0.017751582 -1.262221e-02\nPorsche 914-2 0.0839169111 -0.028670987 -1.240452e-02\nLotus Europa 0.3444562478 -0.402678927 2.135224e-01\nFord Pantera L -0.1598854695 -0.094184733 2.320845e-01\nFerrari Dino -0.0343997122 0.248642444 -2.344154e-01\nMaserati Bora -0.3436265545 -0.511285637 7.319066e-01\nVolvo 142E -0.1784974091 0.132692956 -4.433915e-02\n<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Voor elke waarneming kunnen we het verschil zien in de co\u00ebffici\u00ebntschatting voor de oorsprong, de <em>disp-<\/em> variabele en de <em>hp-<\/em> variabele die optreedt wanneer we die specifieke waarneming verwijderen.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Over het algemeen zijn we van mening dat een waarneming een sterke invloed heeft op de schatting van een bepaalde co\u00ebffici\u00ebnt als deze een DBETAS-waarde heeft die groter is dan een drempelwaarde van 2\/\u221a <span style=\"text-decoration: overline;\">n<\/span> , waarbij <em>n<\/em> het aantal waarnemingen is.<\/span><\/p>\n<p> <span style=\"color: #000000;\">In dit voorbeeld zou de drempel <strong>0,3535534<\/strong> zijn:<\/span><\/p>\n<pre style=\"background-color: #e5e5e5; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#find number of observations<\/span>\nn &lt;- <span style=\"color: #3366ff;\">nrow<\/span> (mtcars)\n\n<span style=\"color: #008080;\">#calculate DFBETAS threshold value<\/span>\nthresh &lt;- 2\/ <span style=\"color: #3366ff;\">sqrt<\/span> (n)\n\nthresh\n\n[1] 0.3535534\n<\/strong><\/pre>\n<p> <strong style=\"color: #000000; font-family: Montserrat, sans-serif; font-size: 24px;\">Stap 3: Visualiseer de DFBETAS<\/strong><\/p>\n<p> <span style=\"color: #000000;\">Ten slotte kunnen we grafieken maken om de DFBETAS-waarde voor elke waarneming en voor elke voorspeller in het model te visualiseren:<\/span> <\/p>\n<pre style=\"background-color: #e5e5e5; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#specify 2 rows and 1 column in plotting region<\/span>\nby(mfrow=c(2,1))\n\n<span style=\"color: #008080;\">#plot DFBETAS for <em>disp<\/em> with threshold lines<\/span>\nplot(dfbetas$disp, type=' <span style=\"color: #008000;\">h<\/span> ')\nabline(h = thresh, lty = 2)\nabline(h = -thresh, lty = 2)\n\n<span style=\"color: #008080;\">#plot DFBETAS for <em>hp<\/em> with threshold lines<\/span> \nplot(dfbetas$hp, type=' <span style=\"color: #008000;\">h<\/span> ')\nabline(h = thresh, lty = 2)\nabline(h = -thresh, lty = 2)\n<\/strong><\/pre>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-12547 \" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/dfbetas1.png\" alt=\"DFBETAS in R\" width=\"486\" height=\"442\" srcset=\"\" sizes=\"auto, \"><\/p>\n<p> <span style=\"color: #000000;\">In elke plot geeft de x-as de index van elke waarneming in de dataset weer en geeft de y-waarde de overeenkomstige DFBETAS weer voor elke waarneming en elke voorspeller.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Op de eerste grafiek kunnen we zien dat drie waarnemingen de absolute drempelwaarde van <strong>0,3535534<\/strong> overschrijden en op de tweede grafiek kunnen we zien dat twee waarnemingen de absolute drempelwaarde overschrijden.<\/span><\/p>\n<p> <span style=\"color: #000000;\">We kunnen ervoor kiezen deze waarnemingen nader te bestuderen om te bepalen of ze een overmatige invloed hebben op de schatting van de modelco\u00ebffici\u00ebnten.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Aanvullende bronnen<\/strong><\/span><\/h3>\n<p> <a href=\"https:\/\/statorials.org\/nl\/eenvoudige-lineaire-regressie-in-r\/\" target=\"_blank\" rel=\"noopener\">Hoe eenvoudige lineaire regressie uit te voeren in R<\/a><br \/> <a href=\"https:\/\/statorials.org\/nl\/meervoudige-lineaire-regressie-r\/\" target=\"_blank\" rel=\"noopener\">Hoe meervoudige lineaire regressie uit te voeren in R<\/a><br \/> <a href=\"https:\/\/statorials.org\/nl\/hefboomwerking-in-r\/\" target=\"_blank\" rel=\"noopener\">Hoe u hefboomstatistieken kunt berekenen in R<\/a><br \/> <a href=\"https:\/\/statorials.org\/nl\/problemen-in-r\/\">Hoe DFFITS in R te berekenen<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>In de statistiek willen we vaak weten welke invloed verschillende observaties hebben op regressiemodellen. E\u00e9n manier om de invloed van waarnemingen te berekenen is door een metriek te gebruiken die bekend staat als DFBETAS , die ons het gestandaardiseerde effect op elke co\u00ebffici\u00ebnt vertelt van het verwijderen van elke individuele waarneming. Deze metriek geeft ons [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"class_list":["post-1276","post","type-post","status-publish","format-standard","hentry","category-gids"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Hoe DFBETAS te berekenen in R - Statorials<\/title>\n<meta name=\"description\" content=\"In deze tutorial wordt met een voorbeeld uitgelegd hoe u DFBETAS in R kunt berekenen.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/nl\/dfbetas-in-r\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Hoe DFBETAS te berekenen in R - Statorials\" \/>\n<meta property=\"og:description\" content=\"In deze tutorial wordt met een voorbeeld uitgelegd hoe u DFBETAS in R kunt berekenen.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/nl\/dfbetas-in-r\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-27T01:24:14+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/dfbetas1.png\" \/>\n<meta name=\"author\" content=\"Dr.benjamin anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"Dr.benjamin anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"3\u00a0Minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/nl\/dfbetas-in-r\/\",\"url\":\"https:\/\/statorials.org\/nl\/dfbetas-in-r\/\",\"name\":\"Hoe DFBETAS te berekenen in R - Statorials\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/nl\/#website\"},\"datePublished\":\"2023-07-27T01:24:14+00:00\",\"dateModified\":\"2023-07-27T01:24:14+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\"},\"description\":\"In deze tutorial wordt met een voorbeeld uitgelegd hoe u DFBETAS in R kunt berekenen.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/nl\/dfbetas-in-r\/#breadcrumb\"},\"inLanguage\":\"de\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/nl\/dfbetas-in-r\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/nl\/dfbetas-in-r\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Thuis\",\"item\":\"https:\/\/statorials.org\/nl\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Hoe dfbetas in r te berekenen\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/nl\/#website\",\"url\":\"https:\/\/statorials.org\/nl\/\",\"name\":\"Statorials\",\"description\":\"Uw gids voor statistische competentie\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/nl\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"de\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\",\"name\":\"Dr.benjamin anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/\",\"url\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"caption\":\"Dr.benjamin anderson\"},\"description\":\"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder\",\"sameAs\":[\"http:\/\/statorials.org\/nl\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Hoe DFBETAS te berekenen in R - Statorials","description":"In deze tutorial wordt met een voorbeeld uitgelegd hoe u DFBETAS in R kunt berekenen.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/nl\/dfbetas-in-r\/","og_locale":"de_DE","og_type":"article","og_title":"Hoe DFBETAS te berekenen in R - Statorials","og_description":"In deze tutorial wordt met een voorbeeld uitgelegd hoe u DFBETAS in R kunt berekenen.","og_url":"https:\/\/statorials.org\/nl\/dfbetas-in-r\/","og_site_name":"Statorials","article_published_time":"2023-07-27T01:24:14+00:00","og_image":[{"url":"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/dfbetas1.png"}],"author":"Dr.benjamin anderson","twitter_card":"summary_large_image","twitter_misc":{"Verfasst von":"Dr.benjamin anderson","Gesch\u00e4tzte Lesezeit":"3\u00a0Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/nl\/dfbetas-in-r\/","url":"https:\/\/statorials.org\/nl\/dfbetas-in-r\/","name":"Hoe DFBETAS te berekenen in R - Statorials","isPartOf":{"@id":"https:\/\/statorials.org\/nl\/#website"},"datePublished":"2023-07-27T01:24:14+00:00","dateModified":"2023-07-27T01:24:14+00:00","author":{"@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219"},"description":"In deze tutorial wordt met een voorbeeld uitgelegd hoe u DFBETAS in R kunt berekenen.","breadcrumb":{"@id":"https:\/\/statorials.org\/nl\/dfbetas-in-r\/#breadcrumb"},"inLanguage":"de","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/nl\/dfbetas-in-r\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/nl\/dfbetas-in-r\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Thuis","item":"https:\/\/statorials.org\/nl\/"},{"@type":"ListItem","position":2,"name":"Hoe dfbetas in r te berekenen"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/nl\/#website","url":"https:\/\/statorials.org\/nl\/","name":"Statorials","description":"Uw gids voor statistische competentie","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/nl\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"de"},{"@type":"Person","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219","name":"Dr.benjamin anderson","image":{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/","url":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","contentUrl":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","caption":"Dr.benjamin anderson"},"description":"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder","sameAs":["http:\/\/statorials.org\/nl"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/1276","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/comments?post=1276"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/1276\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/media?parent=1276"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/categories?post=1276"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/tags?post=1276"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}