{"id":3741,"date":"2023-07-15T20:06:32","date_gmt":"2023-07-15T20:06:32","guid":{"rendered":"https:\/\/statorials.org\/nl\/multicolineariet-in-python\/"},"modified":"2023-07-15T20:06:32","modified_gmt":"2023-07-15T20:06:32","slug":"multicolineariet-in-python","status":"publish","type":"post","link":"https:\/\/statorials.org\/nl\/multicolineariet-in-python\/","title":{"rendered":"Hoe te testen op multicollineariteit in python"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\">Bij regressieanalyse treedt <a href=\"https:\/\/statorials.org\/nl\/multicollineariteitsregressie\/\" target=\"_blank\" rel=\"noopener\">multicollineariteit<\/a> op wanneer twee of meer voorspellende variabelen sterk met elkaar gecorreleerd zijn, zodat ze geen unieke of onafhankelijke informatie verschaffen in het regressiemodel.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Als de mate van correlatie tussen de voorspellende variabelen hoog genoeg is, kan dit problemen veroorzaken bij het aanpassen en interpreteren van het regressiemodel.<\/span><\/p>\n<p> <span style=\"color: #000000;\">De eenvoudigste manier om multicollineariteit in een regressiemodel te detecteren, is door een metriek te berekenen die bekend staat als de variantie-inflatiefactor, vaak afgekort als <strong>VIF<\/strong> .<\/span><\/p>\n<p> <span style=\"color: #000000;\">VIF meet de sterkte van de correlatie tussen voorspellende variabelen in een model. Er is een waarde tussen 1 en positief oneindig nodig.<\/span><\/p>\n<p> <span style=\"color: #000000;\">We gebruiken de volgende vuistregels om VIF-waarden te interpreteren:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\"><strong>VIF = 1:<\/strong> Er is geen correlatie tussen een bepaalde voorspellende variabele en enige andere voorspellende variabele in het model.<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>VIF tussen 1 en 5:<\/strong> Er is een matige correlatie tussen een bepaalde voorspellende variabele en andere voorspellende variabelen in het model.<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>VIF &gt; 5<\/strong> : Er is een sterke correlatie tussen een bepaalde voorspellende variabele en andere voorspellende variabelen in het model.<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Het volgende voorbeeld laat zien hoe u multicollineariteit in een regressiemodel in Python kunt detecteren door VIF-waarden te berekenen voor elke voorspellende variabele in het model.<\/span><\/p>\n<h2> <span style=\"color: #000000;\"><strong>Voorbeeld: multicollineariteitstest in Python<\/strong><\/span><\/h2>\n<p> <span style=\"color: #000000;\">Stel dat we het volgende panda&#8217;s DataFrame hebben dat informatie bevat over verschillende basketbalspelers:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #107d3f;\">import<\/span> pandas <span style=\"color: #107d3f;\">as<\/span> pd\n\n<span style=\"color: #008080;\">#createDataFrame<\/span>\ndf = pd. <span style=\"color: #3366ff;\">DataFrame<\/span> ({' <span style=\"color: #ff0000;\">rating<\/span> ': [90, 85, 82, 88, 94, 90, 76, 75, 87, 86],\n                   ' <span style=\"color: #ff0000;\">points<\/span> ': [25, 20, 14, 16, 27, 20, 12, 15, 14, 19],\n                   ' <span style=\"color: #ff0000;\">assists<\/span> ': [5, 7, 7, 8, 5, 7, 6, 9, 9, 5],\n                   ' <span style=\"color: #ff0000;\">rebounds<\/span> ': [11, 8, 10, 6, 6, 9, 6, 10, 10, 7]})\n\n<span style=\"color: #008080;\">#view DataFrame\n<\/span><span style=\"color: #008000;\">print<\/span> (df)\n\n\trating points assists rebounds\n0 90 25 5 11\n1 85 20 7 8\n2 82 14 7 10\n3 88 16 8 6\n4 94 27 5 6\n5 90 20 7 9\n6 76 12 6 6\n7 75 15 9 10\n8 87 14 9 10\n9 86 19 5 7<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Laten we zeggen dat we een <a href=\"https:\/\/statorials.org\/nl\/meerdere-lineaire-regressie\/\" target=\"_blank\" rel=\"noopener\">meervoudig lineair regressiemodel<\/a> willen passen met behulp van <strong>scoring<\/strong> als de responsvariabele en <strong>points<\/strong> , <strong>assists<\/strong> en <strong>rebounds<\/strong> als de voorspellende variabelen.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Om de <strong>VIF<\/strong> voor elke voorspellende variabele in het model te berekenen, kunnen we de functie <a href=\"https:\/\/www.statsmodels.org\/stable\/generated\/statsmodels.stats.outliers_influence.variance_inflation_factor.html\" target=\"_blank\" rel=\"noopener\">variantie_inflation_factor()<\/a> uit de <strong>statsmodels-<\/strong> bibliotheek gebruiken:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #107d3f;\">from<\/span> patsy <span style=\"color: #107d3f;\">import<\/span> damatrices\n<span style=\"color: #107d3f;\">from<\/span> statsmodels. <span style=\"color: #3366ff;\">stats<\/span> . <span style=\"color: #3366ff;\">outliers_influence<\/span> <span style=\"color: #107d3f;\">import<\/span> variance_inflation_factor\n\n<span style=\"color: #008080;\">#find design matrix for regression model using 'rating' as response variable<\/span> \n<span style=\"color: #ff0000;\">y<\/span> <span style=\"color: #ff0000;\">,<\/span>\n\n<span style=\"color: #008080;\">#create DataFrame to hold VIF values\n<\/span>vive_df = pd. <span style=\"color: #3366ff;\">DataFrame<\/span> ()\nvive_df[' <span style=\"color: #ff0000;\">variable<\/span> '] = <span style=\"color: #3366ff;\">X.columns<\/span> \n\n<span style=\"color: #008080;\">#calculate VIF for each predictor variable<\/span> \nvive_df[' <span style=\"color: #ff0000;\">VIF<\/span> '] = [variance_inflation_factor(X. <span style=\"color: #3366ff;\">values<\/span> , i) <span style=\"color: #008000;\">for<\/span> i <span style=\"color: #008000;\">in<\/span> range(X. <span style=\"color: #3366ff;\">shape<\/span> [1])]\n\n<span style=\"color: #008080;\">#view VIF for each predictor variable<\/span> \n<span style=\"color: #008000;\">print<\/span> (viv_df)\n\n\t       Variable VIF\n0 101.258171 Intercept\n1 1.763977 points\n2 1.959104 assists\n3 1.175030 rebounds<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">We kunnen de VIF-waarden zien voor elk van de voorspellende variabelen:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\"><strong>punten:<\/strong> 1,76<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>assists:<\/strong> 1.96<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>rebounds:<\/strong> 1.18<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\"><strong>Opmerking:<\/strong> Negeer de VIF voor \u201cIntercept\u201d in de sjabloon, aangezien deze waarde niet relevant is.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Omdat elk van de VIF-waarden van de voorspellende variabelen in het model dichtbij 1 ligt, is multicollineariteit geen probleem in het model.<\/span><\/p>\n<h2> <span style=\"color: #000000;\"><strong>Aanvullende bronnen<\/strong><\/span><\/h2>\n<p> <span style=\"color: #000000;\">In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in Python kunt uitvoeren:<\/span><\/p>\n<p> <a href=\"https:\/\/statorials.org\/nl\/eenvoudige-lineaire-regressie-in-python\/\" target=\"_blank\" rel=\"noopener\">Hoe eenvoudige lineaire regressie uit te voeren in Python<\/a><br \/> <a href=\"https:\/\/statorials.org\/nl\/lineaire-regressiepython\/\" target=\"_blank\" rel=\"noopener\">Hoe u meerdere lineaire regressies uitvoert in Python<\/a><br \/> <a href=\"https:\/\/statorials.org\/nl\/python-restgrafiek\/\" target=\"_blank\" rel=\"noopener\">Hoe u een restplot maakt in Python<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Bij regressieanalyse treedt multicollineariteit op wanneer twee of meer voorspellende variabelen sterk met elkaar gecorreleerd zijn, zodat ze geen unieke of onafhankelijke informatie verschaffen in het regressiemodel. Als de mate van correlatie tussen de voorspellende variabelen hoog genoeg is, kan dit problemen veroorzaken bij het aanpassen en interpreteren van het regressiemodel. De eenvoudigste manier om [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"class_list":["post-3741","post","type-post","status-publish","format-standard","hentry","category-gids"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Hoe multicollineariteit in Python te testen - Statorials<\/title>\n<meta name=\"description\" content=\"In deze tutorial wordt aan de hand van een voorbeeld uitgelegd hoe u kunt testen op multicollineariteit in een regressiemodel in Python.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/nl\/multicolineariet-in-python\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Hoe multicollineariteit in Python te testen - Statorials\" \/>\n<meta property=\"og:description\" content=\"In deze tutorial wordt aan de hand van een voorbeeld uitgelegd hoe u kunt testen op multicollineariteit in een regressiemodel in Python.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/nl\/multicolineariet-in-python\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-15T20:06:32+00:00\" \/>\n<meta name=\"author\" content=\"Dr.benjamin anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"Dr.benjamin anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"2\u00a0Minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/nl\/multicolineariet-in-python\/\",\"url\":\"https:\/\/statorials.org\/nl\/multicolineariet-in-python\/\",\"name\":\"Hoe multicollineariteit in Python te testen - Statorials\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/nl\/#website\"},\"datePublished\":\"2023-07-15T20:06:32+00:00\",\"dateModified\":\"2023-07-15T20:06:32+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\"},\"description\":\"In deze tutorial wordt aan de hand van een voorbeeld uitgelegd hoe u kunt testen op multicollineariteit in een regressiemodel in Python.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/nl\/multicolineariet-in-python\/#breadcrumb\"},\"inLanguage\":\"de\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/nl\/multicolineariet-in-python\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/nl\/multicolineariet-in-python\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Thuis\",\"item\":\"https:\/\/statorials.org\/nl\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Hoe te testen op multicollineariteit in python\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/nl\/#website\",\"url\":\"https:\/\/statorials.org\/nl\/\",\"name\":\"Statorials\",\"description\":\"Uw gids voor statistische competentie\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/nl\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"de\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\",\"name\":\"Dr.benjamin anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/\",\"url\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"caption\":\"Dr.benjamin anderson\"},\"description\":\"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder\",\"sameAs\":[\"http:\/\/statorials.org\/nl\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Hoe multicollineariteit in Python te testen - Statorials","description":"In deze tutorial wordt aan de hand van een voorbeeld uitgelegd hoe u kunt testen op multicollineariteit in een regressiemodel in Python.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/nl\/multicolineariet-in-python\/","og_locale":"de_DE","og_type":"article","og_title":"Hoe multicollineariteit in Python te testen - Statorials","og_description":"In deze tutorial wordt aan de hand van een voorbeeld uitgelegd hoe u kunt testen op multicollineariteit in een regressiemodel in Python.","og_url":"https:\/\/statorials.org\/nl\/multicolineariet-in-python\/","og_site_name":"Statorials","article_published_time":"2023-07-15T20:06:32+00:00","author":"Dr.benjamin anderson","twitter_card":"summary_large_image","twitter_misc":{"Verfasst von":"Dr.benjamin anderson","Gesch\u00e4tzte Lesezeit":"2\u00a0Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/nl\/multicolineariet-in-python\/","url":"https:\/\/statorials.org\/nl\/multicolineariet-in-python\/","name":"Hoe multicollineariteit in Python te testen - Statorials","isPartOf":{"@id":"https:\/\/statorials.org\/nl\/#website"},"datePublished":"2023-07-15T20:06:32+00:00","dateModified":"2023-07-15T20:06:32+00:00","author":{"@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219"},"description":"In deze tutorial wordt aan de hand van een voorbeeld uitgelegd hoe u kunt testen op multicollineariteit in een regressiemodel in Python.","breadcrumb":{"@id":"https:\/\/statorials.org\/nl\/multicolineariet-in-python\/#breadcrumb"},"inLanguage":"de","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/nl\/multicolineariet-in-python\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/nl\/multicolineariet-in-python\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Thuis","item":"https:\/\/statorials.org\/nl\/"},{"@type":"ListItem","position":2,"name":"Hoe te testen op multicollineariteit in python"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/nl\/#website","url":"https:\/\/statorials.org\/nl\/","name":"Statorials","description":"Uw gids voor statistische competentie","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/nl\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"de"},{"@type":"Person","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219","name":"Dr.benjamin anderson","image":{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/","url":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","contentUrl":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","caption":"Dr.benjamin anderson"},"description":"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder","sameAs":["http:\/\/statorials.org\/nl"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/3741","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/comments?post=3741"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/3741\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/media?parent=3741"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/categories?post=3741"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/tags?post=3741"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}