{"id":1275,"date":"2023-07-27T01:26:47","date_gmt":"2023-07-27T01:26:47","guid":{"rendered":"https:\/\/statorials.org\/nl\/problemen-in-r\/"},"modified":"2023-07-27T01:26:47","modified_gmt":"2023-07-27T01:26:47","slug":"problemen-in-r","status":"publish","type":"post","link":"https:\/\/statorials.org\/nl\/problemen-in-r\/","title":{"rendered":"Hoe dffits in r te berekenen"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\">In de statistiek willen we vaak weten welke invloed verschillende <a href=\"https:\/\/statorials.org\/nl\/observatie-in-de-statistiek\/\" target=\"_blank\" rel=\"noopener\">observaties<\/a> hebben op regressiemodellen.<\/span><\/p>\n<p> <span style=\"color: #000000;\">E\u00e9n manier om de invloed van observaties te berekenen is door een metriek te gebruiken die bekend staat als <strong>DFFITS<\/strong> , wat staat voor \u2018difference in fits\u2019.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Deze metriek vertelt ons hoeveel de voorspellingen van een regressiemodel veranderen als we een individuele observatie weglaten.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Deze tutorial toont een stapsgewijs voorbeeld van hoe u DFFITS voor elke waarneming in een model in R kunt berekenen en visualiseren.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Stap 1: Maak een regressiemodel<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Eerst zullen we een <a href=\"https:\/\/statorials.org\/nl\/meervoudige-lineaire-regressie-r\/\" target=\"_blank\" rel=\"noopener\">meervoudig lineair regressiemodel<\/a> maken met behulp van de <strong>mtcars-<\/strong> dataset die in R is ingebouwd:<\/span><\/p>\n<pre style=\"background-color: #e5e5e5; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#load the dataset<\/span>\ndata(mtcars)\n\n<span style=\"color: #008080;\">#fit a regression model<\/span>\nmodel &lt;- lm(mpg~disp+hp, data=mtcars)\n\n<span style=\"color: #008080;\">#view model summary\n<\/span>summary(model)\n\nCoefficients:\n             Estimate Std. Error t value Pr(&gt;|t|)    \n(Intercept) 30.735904 1.331566 23.083 &lt; 2nd-16 ***\navailable -0.030346 0.007405 -4.098 0.000306 ***\nhp -0.024840 0.013385 -1.856 0.073679 .  \n---\nSignificant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1\n\nResidual standard error: 3.127 on 29 degrees of freedom\nMultiple R-squared: 0.7482, Adjusted R-squared: 0.7309 \nF-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09\n<\/strong><\/pre>\n<h3> <span style=\"color: #000000;\"><strong>Stap 2: Bereken DFFITS voor elke waarneming<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Vervolgens zullen we de ingebouwde functie <strong>dffits()<\/strong> gebruiken om de DFFITS-waarde voor elke waarneming in het model te berekenen:<\/span><\/p>\n<pre style=\"background-color: #e5e5e5; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#calculate DFFITS for each observation in the model\n<\/span>dffits &lt;- <span style=\"color: #3366ff;\">as<\/span> . <span style=\"color: #3366ff;\">data<\/span> . <span style=\"color: #3366ff;\">frame<\/span> (dffits(model))\n\n<span style=\"color: #008080;\">#display DFFITS for each observation\n<\/span>challenges\n\n                    dffits(model)\nMazda RX4 -0.14633456\nMazda RX4 Wag -0.14633456\nDatsun 710 -0.19956440\nHornet 4 Drive 0.11540062\nHornet Sportabout 0.32140303\nValiant -0.26586716\nDuster 360 0.06282342\nMerc 240D -0.03521572\nMerc 230 -0.09780612\nMerc 280 -0.22680622\nMerc 280C -0.32763355\nMerc 450SE -0.09682952\nMerc 450SL -0.03841129\nMerc 450SLC -0.17618948\nCadillac Fleetwood -0.15860270\nLincoln Continental -0.15567627\nChrysler Imperial 0.39098449\nFiat 128 0.60265798\nHonda Civic 0.35544919\nToyota Corolla 0.78230167\nToyota Corona -0.25804885\nDodge Challenger -0.16674639\nAMC Javelin -0.20965432\nCamaro Z28 -0.08062828\nPontiac Firebird 0.67858692\nFiat X1-9 0.05951528\nPorsche 914-2 0.09453310\nLotus Europa 0.55650363\nFord Pantera L 0.31169050\nFerrari Dino -0.29539098\nMaserati Bora 0.76464932\nVolvo 142E -0.24266054\n<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Meestal bekijken we waarnemingen met DFFITS-waarden boven een drempel van 2\u221a <span style=\"text-decoration: overline;\">p\/n<\/span> waarbij:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\"><strong>p:<\/strong> Aantal voorspellende variabelen dat in het model wordt gebruikt<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>n:<\/strong> Aantal waarnemingen gebruikt in het model<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">In dit voorbeeld zou de drempel <strong>0,5<\/strong> zijn:<\/span><\/p>\n<pre style=\"background-color: #e5e5e5; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#find number of predictors in model\n<\/span>p &lt;- <span style=\"color: #3366ff;\">length<\/span> (model$coefficients)-1\n\n<span style=\"color: #008080;\">#find number of observations<\/span>\nn &lt;- <span style=\"color: #3366ff;\">nrow<\/span> (mtcars)\n\n<span style=\"color: #008080;\">#calculate DFFITS threshold value<\/span>\nthresh &lt;- 2* <span style=\"color: #3366ff;\">sqrt<\/span> (p\/n)\n\nthresh\n\n[1] 0.5\n<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">We kunnen de waarnemingen sorteren op basis van hun DFFITS-waarden om te zien of een van hen de drempel overschrijdt:<\/span><\/p>\n<pre style=\"background-color: #e5e5e5; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#sort observations by DFFITS, descending<\/span>\ndffits[ <span style=\"color: #3366ff;\">order<\/span> (-dffits[' <span style=\"color: #008000;\">dffits(model)<\/span> ']), ]\n\n [1] 0.78230167 0.76464932 0.67858692 0.60265798 0.55650363 0.39098449\n [7] 0.35544919 0.32140303 0.31169050 0.11540062 0.09453310 0.06282342\n[13] 0.05951528 -0.03521572 -0.03841129 -0.08062828 -0.09682952 -0.09780612\n[19] -0.14633456 -0.14633456 -0.15567627 -0.15860270 -0.16674639 -0.17618948\n[25] -0.19956440 -0.20965432 -0.22680622 -0.24266054 -0.25804885 -0.26586716\n[31] -0.29539098 -0.32763355\n<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">We kunnen zien dat de eerste vijf waarnemingen een DFFITS-waarde groter dan 0,5 hebben, wat betekent dat we deze waarnemingen wellicht nader willen bestuderen om te bepalen of ze een grote invloed op het model hebben.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Stap 3: Visualiseer de DFFITS voor elke waarneming<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Ten slotte kunnen we een snelle grafiek maken om de DFFITS voor elke waarneming te visualiseren:<\/span> <\/p>\n<pre style=\"background-color: #e5e5e5; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#plot DFFITS values for each observation<\/span>\nplot(dffits(model), type = ' <span style=\"color: #008000;\">h<\/span> ')\n\n<span style=\"color: #008080;\">#add horizontal lines at absolute values for threshold<\/span>\nabline(h = thresh, lty = 2)\nabline(h = -thresh, lty = 2)\n<\/strong><\/pre>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-12542 \" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/dffits1.png\" alt=\"DFFITS in R\" width=\"451\" height=\"405\" srcset=\"\" sizes=\"auto, \"><\/p>\n<p> <span style=\"color: #000000;\">Op de x-as wordt de index van elke waarneming in de dataset weergegeven en op de y-waarde wordt de overeenkomstige DFFITS-waarde voor elke waarneming weergegeven.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Aanvullende bronnen<\/strong><\/span><\/h3>\n<p> <a href=\"https:\/\/statorials.org\/nl\/eenvoudige-lineaire-regressie-in-r\/\" target=\"_blank\" rel=\"noopener\">Hoe eenvoudige lineaire regressie uit te voeren in R<\/a><br \/> <a href=\"https:\/\/statorials.org\/nl\/meervoudige-lineaire-regressie-r\/\" target=\"_blank\" rel=\"noopener\">Hoe meervoudige lineaire regressie uit te voeren in R<\/a><br \/> <a href=\"https:\/\/statorials.org\/nl\/hefboomwerking-in-r\/\" target=\"_blank\" rel=\"noopener\">Hoe u hefboomstatistieken kunt berekenen in R<\/a><br \/> <a href=\"https:\/\/statorials.org\/nl\/restspoor-r\/\" target=\"_blank\" rel=\"noopener\">Hoe maak je een restplot in R<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>In de statistiek willen we vaak weten welke invloed verschillende observaties hebben op regressiemodellen. E\u00e9n manier om de invloed van observaties te berekenen is door een metriek te gebruiken die bekend staat als DFFITS , wat staat voor \u2018difference in fits\u2019. Deze metriek vertelt ons hoeveel de voorspellingen van een regressiemodel veranderen als we een [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"class_list":["post-1275","post","type-post","status-publish","format-standard","hentry","category-gids"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Hoe DFFITS te berekenen in R - Statorials<\/title>\n<meta name=\"description\" content=\"In deze tutorial wordt uitgelegd hoe u DFFITS in R kunt berekenen, inclusief een stapsgewijs voorbeeld.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/nl\/problemen-in-r\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Hoe DFFITS te berekenen in R - Statorials\" \/>\n<meta property=\"og:description\" content=\"In deze tutorial wordt uitgelegd hoe u DFFITS in R kunt berekenen, inclusief een stapsgewijs voorbeeld.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/nl\/problemen-in-r\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-27T01:26:47+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/dffits1.png\" \/>\n<meta name=\"author\" content=\"Dr.benjamin anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"Dr.benjamin anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"3\u00a0Minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/nl\/problemen-in-r\/\",\"url\":\"https:\/\/statorials.org\/nl\/problemen-in-r\/\",\"name\":\"Hoe DFFITS te berekenen in R - Statorials\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/nl\/#website\"},\"datePublished\":\"2023-07-27T01:26:47+00:00\",\"dateModified\":\"2023-07-27T01:26:47+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\"},\"description\":\"In deze tutorial wordt uitgelegd hoe u DFFITS in R kunt berekenen, inclusief een stapsgewijs voorbeeld.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/nl\/problemen-in-r\/#breadcrumb\"},\"inLanguage\":\"de\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/nl\/problemen-in-r\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/nl\/problemen-in-r\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Thuis\",\"item\":\"https:\/\/statorials.org\/nl\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Hoe dffits in r te berekenen\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/nl\/#website\",\"url\":\"https:\/\/statorials.org\/nl\/\",\"name\":\"Statorials\",\"description\":\"Uw gids voor statistische competentie\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/nl\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"de\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\",\"name\":\"Dr.benjamin anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/\",\"url\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"caption\":\"Dr.benjamin anderson\"},\"description\":\"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder\",\"sameAs\":[\"http:\/\/statorials.org\/nl\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Hoe DFFITS te berekenen in R - Statorials","description":"In deze tutorial wordt uitgelegd hoe u DFFITS in R kunt berekenen, inclusief een stapsgewijs voorbeeld.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/nl\/problemen-in-r\/","og_locale":"de_DE","og_type":"article","og_title":"Hoe DFFITS te berekenen in R - Statorials","og_description":"In deze tutorial wordt uitgelegd hoe u DFFITS in R kunt berekenen, inclusief een stapsgewijs voorbeeld.","og_url":"https:\/\/statorials.org\/nl\/problemen-in-r\/","og_site_name":"Statorials","article_published_time":"2023-07-27T01:26:47+00:00","og_image":[{"url":"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/dffits1.png"}],"author":"Dr.benjamin anderson","twitter_card":"summary_large_image","twitter_misc":{"Verfasst von":"Dr.benjamin anderson","Gesch\u00e4tzte Lesezeit":"3\u00a0Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/nl\/problemen-in-r\/","url":"https:\/\/statorials.org\/nl\/problemen-in-r\/","name":"Hoe DFFITS te berekenen in R - Statorials","isPartOf":{"@id":"https:\/\/statorials.org\/nl\/#website"},"datePublished":"2023-07-27T01:26:47+00:00","dateModified":"2023-07-27T01:26:47+00:00","author":{"@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219"},"description":"In deze tutorial wordt uitgelegd hoe u DFFITS in R kunt berekenen, inclusief een stapsgewijs voorbeeld.","breadcrumb":{"@id":"https:\/\/statorials.org\/nl\/problemen-in-r\/#breadcrumb"},"inLanguage":"de","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/nl\/problemen-in-r\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/nl\/problemen-in-r\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Thuis","item":"https:\/\/statorials.org\/nl\/"},{"@type":"ListItem","position":2,"name":"Hoe dffits in r te berekenen"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/nl\/#website","url":"https:\/\/statorials.org\/nl\/","name":"Statorials","description":"Uw gids voor statistische competentie","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/nl\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"de"},{"@type":"Person","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219","name":"Dr.benjamin anderson","image":{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/","url":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","contentUrl":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","caption":"Dr.benjamin anderson"},"description":"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder","sameAs":["http:\/\/statorials.org\/nl"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/1275","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/comments?post=1275"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/1275\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/media?parent=1275"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/categories?post=1275"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/tags?post=1275"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}