{"id":2257,"date":"2023-07-23T01:30:54","date_gmt":"2023-07-23T01:30:54","guid":{"rendered":"https:\/\/statorials.org\/nl\/voorspelling-op-basis-van-een-slechte-fit-rang-kan-misleidend-zijn\/"},"modified":"2023-07-23T01:30:54","modified_gmt":"2023-07-23T01:30:54","slug":"voorspelling-op-basis-van-een-slechte-fit-rang-kan-misleidend-zijn","status":"publish","type":"post","link":"https:\/\/statorials.org\/nl\/voorspelling-op-basis-van-een-slechte-fit-rang-kan-misleidend-zijn\/","title":{"rendered":"Oplossing: het voorspellen van een slechte rangschikking kan misleidend zijn"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\">Een veel voorkomende waarschuwing die u in R kunt tegenkomen is:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <span style=\"color: #000000;\"><strong>Warning message:\nIn predict.lm(model, df):\n  prediction from a rank-deficient fit may be misleading\n<\/strong><\/span><\/pre>\n<p> <span style=\"color: #000000;\">Deze waarschuwing kan om twee redenen optreden:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Reden 1<\/strong> : Twee voorspellende variabelen zijn perfect gecorreleerd.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Reden 2<\/strong> : U heeft meer modelparameters dan waarnemingen in de dataset.<\/span><\/p>\n<p> <span style=\"color: #000000;\">De volgende voorbeelden laten zien hoe elk probleem in de praktijk kan ontstaan.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Reden #1: Twee voorspellende variabelen zijn perfect gecorreleerd<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Stel dat we het volgende meervoudige lineaire regressiemodel in R passen en proberen het te gebruiken om voorspellingen te doen:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\"><span style=\"color: #000000;\"><span style=\"color: #008080;\">#create data frame\n<\/span>df &lt;- data. <span style=\"color: #3366ff;\">frame<\/span> (x1=c(1, 2, 3, 4),\n                 x2=c(2, 4, 6, 8),\n                 y=c(6, 10, 19, 26))\n\n<span style=\"color: #008080;\">#fit multiple linear regression model\n<\/span>model &lt;- lm(y~x1+x2, data=df)\n\n<span style=\"color: #008080;\">#use model to make predictions\n<\/span>predict(model, df)\n\n   1 2 3 4 \n 4.9 11.8 18.7 25.6 \nWarning message:\nIn predict.lm(model, df):\n  prediction from a rank-deficient fit may be misleading<\/span><\/span><\/strong><\/pre>\n<p> <span style=\"color: #000000;\">We ontvangen een waarschuwingsbericht omdat de voorspellende variabelen x1 en x2 <strong>perfect gecorreleerd<\/strong> zijn.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Merk op dat de x2-waarden eenvoudigweg gelijk zijn aan de x1-waarden vermenigvuldigd met twee. Dit is een voorbeeld van <a href=\"https:\/\/statorials.org\/nl\/perfecte-multicollineariet\/\" target=\"_blank\" rel=\"noopener\">perfecte multicollineariteit<\/a> .<\/span><\/p>\n<p> <span style=\"color: #000000;\">Dit betekent dat x1 en x2 geen unieke of onafhankelijke informatie bieden in het regressiemodel, wat problemen veroorzaakt bij het aanpassen en interpreteren van het model.<\/span><\/p>\n<p> <span style=\"color: #000000;\">De eenvoudigste manier om dit probleem op te lossen is door eenvoudigweg \u00e9\u00e9n van de voorspellende variabelen uit het model te verwijderen, aangezien het overbodig is om beide voorspellende variabelen in het model te hebben.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Reden #2: Er zijn meer modelparameters dan waarnemingen<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Stel dat we het volgende meervoudige lineaire regressiemodel in R passen en proberen het te gebruiken om voorspellingen te doen:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\"><span style=\"color: #000000;\"><span style=\"color: #008080;\">#create data frame\n<\/span>df &lt;- data. <span style=\"color: #3366ff;\">frame<\/span> (x1=c(1, 2, 3, 4),\n                 x2=c(3, 3, 8, 12),\n                 x3=c(4, 6, 3, 11),\n                 y=c(6, 10, 19, 26))\n\n<span style=\"color: #008080;\">#fit multiple linear regression model\n<\/span>model &lt;- lm(y~x1*x2*x3, data=df)\n\n<span style=\"color: #008080;\">#use model to make predictions\n<\/span>predict(model, df)\n\n 1 2 3 4 \n 6 10 19 26 \nWarning message:\nIn predict.lm(model, df):\n  prediction from a rank-deficient fit may be misleading\n<\/span><\/span><\/strong><\/pre>\n<p> <span style=\"color: #000000;\">We ontvangen een waarschuwingsbericht omdat we hebben geprobeerd een regressiemodel te fitten met zeven totale modelco\u00ebffici\u00ebnten:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">x1<\/span><\/li>\n<li> <span style=\"color: #000000;\">x2<\/span><\/li>\n<li> <span style=\"color: #000000;\">x3<\/span><\/li>\n<li> <span style=\"color: #000000;\">x1*x2<\/span><\/li>\n<li> <span style=\"color: #000000;\">x1*3<\/span><\/li>\n<li> <span style=\"color: #000000;\">x2*x3<\/span><\/li>\n<li> <span style=\"color: #000000;\">x1*x2*x3<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">We hebben echter in totaal slechts vier waarnemingen in de dataset.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Omdat het aantal modelparameters groter is dan het aantal waarnemingen in de dataset, noemen we dit <a href=\"https:\/\/statorials.org\/nl\/hoge-dimensionale-gegevens\/\" target=\"_blank\" rel=\"noopener\">hoogdimensionale gegevens<\/a> .<\/span><\/p>\n<p> <span style=\"color: #000000;\"><span style=\"color: #000000;\">Met hoogdimensionale gegevens<\/span> wordt het onmogelijk om een model te vinden dat de relatie tussen de voorspellende variabelen en de responsvariabele kan beschrijven, omdat we niet genoeg observaties hebben waarop we het model kunnen trainen.<\/span><\/p>\n<p> <span style=\"color: #000000;\">De eenvoudigste manier om dit probleem op te lossen is door meer waarnemingen te verzamelen voor onze dataset of door een eenvoudiger model te gebruiken met minder te schatten co\u00ebffici\u00ebnten.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Aanvullende bronnen<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">In de volgende tutorials wordt uitgelegd hoe u met andere veelvoorkomende fouten in R omgaat:<\/span><\/p>\n<p> <a href=\"https:\/\/statorials.org\/nl\/het-glm-fit-algoritme-convergeerde-niet\/\" target=\"_blank\" rel=\"noopener\">Hoe te handelen: glm.fit: het algoritme is niet geconvergeerd<\/a><br \/> <a href=\"https:\/\/statorials.org\/nl\/glm-fit-gepaste-kansen-numeriek-0-of-1-opgetreden\/\" target=\"_blank\" rel=\"noopener\">Hoe te handelen: glm.fit: numeriek aangepaste kansen 0 of 1 zijn opgetreden<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Een veel voorkomende waarschuwing die u in R kunt tegenkomen is: Warning message: In predict.lm(model, df): prediction from a rank-deficient fit may be misleading Deze waarschuwing kan om twee redenen optreden: Reden 1 : Twee voorspellende variabelen zijn perfect gecorreleerd. Reden 2 : U heeft meer modelparameters dan waarnemingen in de dataset. De volgende voorbeelden [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"class_list":["post-2257","post","type-post","status-publish","format-standard","hentry","category-gids"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Los het probleem op: voorspelling op basis van een slechte ranking kan misleidend zijn - Statorials<\/title>\n<meta name=\"description\" content=\"In deze tutorial wordt uitgelegd hoe u omgaat met het volgende waarschuwingsbericht in R: Voorspellingen door een slechte rangaanpassing kunnen misleidend zijn.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/nl\/voorspelling-op-basis-van-een-slechte-fit-rang-kan-misleidend-zijn\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Los het probleem op: voorspelling op basis van een slechte ranking kan misleidend zijn - Statorials\" \/>\n<meta property=\"og:description\" content=\"In deze tutorial wordt uitgelegd hoe u omgaat met het volgende waarschuwingsbericht in R: Voorspellingen door een slechte rangaanpassing kunnen misleidend zijn.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/nl\/voorspelling-op-basis-van-een-slechte-fit-rang-kan-misleidend-zijn\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-23T01:30:54+00:00\" \/>\n<meta name=\"author\" content=\"Dr.benjamin anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"Dr.benjamin anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"2\u00a0Minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/nl\/voorspelling-op-basis-van-een-slechte-fit-rang-kan-misleidend-zijn\/\",\"url\":\"https:\/\/statorials.org\/nl\/voorspelling-op-basis-van-een-slechte-fit-rang-kan-misleidend-zijn\/\",\"name\":\"Los het probleem op: voorspelling op basis van een slechte ranking kan misleidend zijn - Statorials\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/nl\/#website\"},\"datePublished\":\"2023-07-23T01:30:54+00:00\",\"dateModified\":\"2023-07-23T01:30:54+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\"},\"description\":\"In deze tutorial wordt uitgelegd hoe u omgaat met het volgende waarschuwingsbericht in R: Voorspellingen door een slechte rangaanpassing kunnen misleidend zijn.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/nl\/voorspelling-op-basis-van-een-slechte-fit-rang-kan-misleidend-zijn\/#breadcrumb\"},\"inLanguage\":\"de\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/nl\/voorspelling-op-basis-van-een-slechte-fit-rang-kan-misleidend-zijn\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/nl\/voorspelling-op-basis-van-een-slechte-fit-rang-kan-misleidend-zijn\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Thuis\",\"item\":\"https:\/\/statorials.org\/nl\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Oplossing: het voorspellen van een slechte rangschikking kan misleidend zijn\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/nl\/#website\",\"url\":\"https:\/\/statorials.org\/nl\/\",\"name\":\"Statorials\",\"description\":\"Uw gids voor statistische competentie\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/nl\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"de\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\",\"name\":\"Dr.benjamin anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/\",\"url\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"caption\":\"Dr.benjamin anderson\"},\"description\":\"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder\",\"sameAs\":[\"http:\/\/statorials.org\/nl\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Los het probleem op: voorspelling op basis van een slechte ranking kan misleidend zijn - Statorials","description":"In deze tutorial wordt uitgelegd hoe u omgaat met het volgende waarschuwingsbericht in R: Voorspellingen door een slechte rangaanpassing kunnen misleidend zijn.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/nl\/voorspelling-op-basis-van-een-slechte-fit-rang-kan-misleidend-zijn\/","og_locale":"de_DE","og_type":"article","og_title":"Los het probleem op: voorspelling op basis van een slechte ranking kan misleidend zijn - Statorials","og_description":"In deze tutorial wordt uitgelegd hoe u omgaat met het volgende waarschuwingsbericht in R: Voorspellingen door een slechte rangaanpassing kunnen misleidend zijn.","og_url":"https:\/\/statorials.org\/nl\/voorspelling-op-basis-van-een-slechte-fit-rang-kan-misleidend-zijn\/","og_site_name":"Statorials","article_published_time":"2023-07-23T01:30:54+00:00","author":"Dr.benjamin anderson","twitter_card":"summary_large_image","twitter_misc":{"Verfasst von":"Dr.benjamin anderson","Gesch\u00e4tzte Lesezeit":"2\u00a0Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/nl\/voorspelling-op-basis-van-een-slechte-fit-rang-kan-misleidend-zijn\/","url":"https:\/\/statorials.org\/nl\/voorspelling-op-basis-van-een-slechte-fit-rang-kan-misleidend-zijn\/","name":"Los het probleem op: voorspelling op basis van een slechte ranking kan misleidend zijn - Statorials","isPartOf":{"@id":"https:\/\/statorials.org\/nl\/#website"},"datePublished":"2023-07-23T01:30:54+00:00","dateModified":"2023-07-23T01:30:54+00:00","author":{"@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219"},"description":"In deze tutorial wordt uitgelegd hoe u omgaat met het volgende waarschuwingsbericht in R: Voorspellingen door een slechte rangaanpassing kunnen misleidend zijn.","breadcrumb":{"@id":"https:\/\/statorials.org\/nl\/voorspelling-op-basis-van-een-slechte-fit-rang-kan-misleidend-zijn\/#breadcrumb"},"inLanguage":"de","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/nl\/voorspelling-op-basis-van-een-slechte-fit-rang-kan-misleidend-zijn\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/nl\/voorspelling-op-basis-van-een-slechte-fit-rang-kan-misleidend-zijn\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Thuis","item":"https:\/\/statorials.org\/nl\/"},{"@type":"ListItem","position":2,"name":"Oplossing: het voorspellen van een slechte rangschikking kan misleidend zijn"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/nl\/#website","url":"https:\/\/statorials.org\/nl\/","name":"Statorials","description":"Uw gids voor statistische competentie","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/nl\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"de"},{"@type":"Person","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219","name":"Dr.benjamin anderson","image":{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/","url":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","contentUrl":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","caption":"Dr.benjamin anderson"},"description":"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder","sameAs":["http:\/\/statorials.org\/nl"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/2257","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/comments?post=2257"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/2257\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/media?parent=2257"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/categories?post=2257"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/tags?post=2257"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}