{"id":869,"date":"2023-07-28T11:53:32","date_gmt":"2023-07-28T11:53:32","guid":{"rendered":"https:\/\/statorials.org\/nl\/hoe-vive-in-python-te-berekenen\/"},"modified":"2023-07-28T11:53:32","modified_gmt":"2023-07-28T11:53:32","slug":"hoe-vive-in-python-te-berekenen","status":"publish","type":"post","link":"https:\/\/statorials.org\/nl\/hoe-vive-in-python-te-berekenen\/","title":{"rendered":"Hoe vif in python te berekenen"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\"><a href=\"https:\/\/statorials.org\/nl\/multicollineariteitsregressie\/\" target=\"_blank\" rel=\"noopener\">Multicollineariteit<\/a> bij regressieanalyse treedt op wanneer twee of meer verklarende variabelen sterk met elkaar gecorreleerd zijn, zodat ze geen unieke of onafhankelijke informatie verschaffen in het regressiemodel.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Als de mate van correlatie tussen variabelen hoog genoeg is, kan dit problemen veroorzaken bij het aanpassen en interpreteren van het regressiemodel.<\/span><\/p>\n<p> <span style=\"color: #000000;\">E\u00e9n manier om multicollineariteit te detecteren is door een metriek te gebruiken die bekend staat als <strong>de variantie-inflatiefactor (VIF)<\/strong> , die de correlatie en sterkte van de correlatie tussen verklarende variabelen in een <a href=\"https:\/\/statorials.org\/nl\/lineaire-regressiepython\/\" target=\"_blank\" rel=\"noopener\">regressiemodel<\/a> meet.<\/span><\/p>\n<p> <span style=\"color: #000000;\">In deze tutorial wordt uitgelegd hoe je VIF in Python berekent.<\/span><\/p>\n<h2> <span style=\"color: #000000;\"><strong>Voorbeeld: Bereken VIF in Python<\/strong><\/span><\/h2>\n<p> <span style=\"color: #000000;\">Voor dit voorbeeld gebruiken we een dataset die de kenmerken van 10 basketbalspelers beschrijft:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #107d3f;\">import<\/span> numpy <span style=\"color: #107d3f;\">as<\/span> np\n<span style=\"color: #107d3f;\">import<\/span> pandas <span style=\"color: #107d3f;\">as<\/span> pd\n\n<span style=\"color: #008080;\">#create dataset<\/span>\ndf = pd.DataFrame({'rating': [90, 85, 82, 88, 94, 90, 76, 75, 87, 86],\n                   'points': [25, 20, 14, 16, 27, 20, 12, 15, 14, 19],\n                   'assists': [5, 7, 7, 8, 5, 7, 6, 9, 9, 5],\n                   'rebounds': [11, 8, 10, 6, 6, 9, 6, 10, 10, 7]})\n\n<span style=\"color: #008080;\">#view dataset\n<\/span>df\n\n\trating points assists rebounds\n0 90 25 5 11\n1 85 20 7 8\n2 82 14 7 10\n3 88 16 8 6\n4 94 27 5 6\n5 90 20 7 9\n6 76 12 6 6\n7 75 15 9 10\n8 87 14 9 10\n9 86 19 5 7<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Stel dat we een meervoudig lineair regressiemodel willen toepassen met scores als responsvariabele en punten, assists en rebounds als verklarende variabelen.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Om de VIF voor elke verklarende variabele in het model te berekenen, kunnen we de <a href=\"https:\/\/www.statsmodels.org\/stable\/generated\/statsmodels.stats.outliers_influence.variance_inflation_factor.html\" target=\"_blank\" rel=\"noopener\">functie variantie_inflation_factor()<\/a> uit de statsmodels-bibliotheek gebruiken:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #107d3f;\">from<\/span> patsy <span style=\"color: #107d3f;\">import<\/span> damatrices\n<span style=\"color: #107d3f;\">from<\/span> statsmodels.stats.outliers_influence <span style=\"color: #107d3f;\">import<\/span> variance_inflation_factor\n\n<span style=\"color: #008080;\">#find design matrix for linear regression model using 'rating' as response variable<\/span> \ny, X = dmatrices('rating ~ points+assists+rebounds', data=df, return_type='dataframe')\n\n<span style=\"color: #008080;\">#calculate VIF for each explanatory variable<\/span>\nvivid = pd.DataFrame()\nvive['VIF'] = [variance_inflation_factor(X.values, i) for i in range(X.shape[1])]\nvivid['variable'] = X.columns\n\n<span style=\"color: #008080;\">#view VIF for each explanatory variable<\/span> \nlively\n\n\t       Variable VIF\n0 101.258171 Intercept\n1 1.763977 points\n2 1.959104 assists\n3 1.175030 rebounds<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">We kunnen de VIF-waarden voor elk van de verklarende variabelen observeren:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\"><strong>punten:<\/strong> 1,76<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>assists:<\/strong> 1.96<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>rebounds:<\/strong> 1.18<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\"><em><strong>Opmerking:<\/strong> Negeer de VIF voor \u201cIntercept\u201d in de sjabloon, aangezien deze waarde niet relevant is.<\/em><\/span><\/p>\n<h2> <strong>Hoe VIF-waarden te interpreteren<\/strong><\/h2>\n<p> <span style=\"color: #000000;\">De VIF-waarde begint bij 1 en heeft geen bovengrens. Een algemene regel voor het interpreteren van VIF&#8217;s is:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Een waarde van 1 geeft aan dat er geen correlatie bestaat tussen een bepaalde verklarende variabele en enige andere verklarende variabele in het model.<\/span><\/li>\n<li> <span style=\"color: #000000;\">Een waarde tussen 1 en 5 duidt op een gematigde correlatie tussen een bepaalde verklarende variabele en andere verklarende variabelen in het model, maar deze is vaak niet ernstig genoeg om speciale aandacht te vereisen.<\/span><\/li>\n<li> <span style=\"color: #000000;\">Een waarde groter dan 5 duidt op een potentieel ernstige correlatie tussen een bepaalde verklarende variabele en andere verklarende variabelen in het model. In dit geval zijn de co\u00ebffici\u00ebntschattingen en p-waarden in de regressieresultaten waarschijnlijk onbetrouwbaar.<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Omdat elk van de VIF-waarden van de verklarende variabelen in ons regressiemodel gesloten is op 1, is multicollineariteit in ons voorbeeld geen probleem.<\/span><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Multicollineariteit bij regressieanalyse treedt op wanneer twee of meer verklarende variabelen sterk met elkaar gecorreleerd zijn, zodat ze geen unieke of onafhankelijke informatie verschaffen in het regressiemodel. Als de mate van correlatie tussen variabelen hoog genoeg is, kan dit problemen veroorzaken bij het aanpassen en interpreteren van het regressiemodel. E\u00e9n manier om multicollineariteit te detecteren [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"class_list":["post-869","post","type-post","status-publish","format-standard","hentry","category-gids"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Hoe VIF in Python te berekenen - Statorials<\/title>\n<meta name=\"description\" content=\"Een eenvoudige uitleg over het berekenen van VIF (Variance Inflation Factor) in Python.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/nl\/hoe-vive-in-python-te-berekenen\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Hoe VIF in Python te berekenen - Statorials\" \/>\n<meta property=\"og:description\" content=\"Een eenvoudige uitleg over het berekenen van VIF (Variance Inflation Factor) in Python.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/nl\/hoe-vive-in-python-te-berekenen\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-28T11:53:32+00:00\" \/>\n<meta name=\"author\" content=\"Dr.benjamin anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"Dr.benjamin anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"2\u00a0Minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/nl\/hoe-vive-in-python-te-berekenen\/\",\"url\":\"https:\/\/statorials.org\/nl\/hoe-vive-in-python-te-berekenen\/\",\"name\":\"Hoe VIF in Python te berekenen - Statorials\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/nl\/#website\"},\"datePublished\":\"2023-07-28T11:53:32+00:00\",\"dateModified\":\"2023-07-28T11:53:32+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\"},\"description\":\"Een eenvoudige uitleg over het berekenen van VIF (Variance Inflation Factor) in Python.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/nl\/hoe-vive-in-python-te-berekenen\/#breadcrumb\"},\"inLanguage\":\"de\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/nl\/hoe-vive-in-python-te-berekenen\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/nl\/hoe-vive-in-python-te-berekenen\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Thuis\",\"item\":\"https:\/\/statorials.org\/nl\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Hoe vif in python te berekenen\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/nl\/#website\",\"url\":\"https:\/\/statorials.org\/nl\/\",\"name\":\"Statorials\",\"description\":\"Uw gids voor statistische competentie\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/nl\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"de\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\",\"name\":\"Dr.benjamin anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/\",\"url\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"caption\":\"Dr.benjamin anderson\"},\"description\":\"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder\",\"sameAs\":[\"http:\/\/statorials.org\/nl\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Hoe VIF in Python te berekenen - Statorials","description":"Een eenvoudige uitleg over het berekenen van VIF (Variance Inflation Factor) in Python.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/nl\/hoe-vive-in-python-te-berekenen\/","og_locale":"de_DE","og_type":"article","og_title":"Hoe VIF in Python te berekenen - Statorials","og_description":"Een eenvoudige uitleg over het berekenen van VIF (Variance Inflation Factor) in Python.","og_url":"https:\/\/statorials.org\/nl\/hoe-vive-in-python-te-berekenen\/","og_site_name":"Statorials","article_published_time":"2023-07-28T11:53:32+00:00","author":"Dr.benjamin anderson","twitter_card":"summary_large_image","twitter_misc":{"Verfasst von":"Dr.benjamin anderson","Gesch\u00e4tzte Lesezeit":"2\u00a0Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/nl\/hoe-vive-in-python-te-berekenen\/","url":"https:\/\/statorials.org\/nl\/hoe-vive-in-python-te-berekenen\/","name":"Hoe VIF in Python te berekenen - Statorials","isPartOf":{"@id":"https:\/\/statorials.org\/nl\/#website"},"datePublished":"2023-07-28T11:53:32+00:00","dateModified":"2023-07-28T11:53:32+00:00","author":{"@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219"},"description":"Een eenvoudige uitleg over het berekenen van VIF (Variance Inflation Factor) in Python.","breadcrumb":{"@id":"https:\/\/statorials.org\/nl\/hoe-vive-in-python-te-berekenen\/#breadcrumb"},"inLanguage":"de","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/nl\/hoe-vive-in-python-te-berekenen\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/nl\/hoe-vive-in-python-te-berekenen\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Thuis","item":"https:\/\/statorials.org\/nl\/"},{"@type":"ListItem","position":2,"name":"Hoe vif in python te berekenen"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/nl\/#website","url":"https:\/\/statorials.org\/nl\/","name":"Statorials","description":"Uw gids voor statistische competentie","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/nl\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"de"},{"@type":"Person","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219","name":"Dr.benjamin anderson","image":{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/","url":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","contentUrl":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","caption":"Dr.benjamin anderson"},"description":"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder","sameAs":["http:\/\/statorials.org\/nl"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/869","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/comments?post=869"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/869\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/media?parent=869"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/categories?post=869"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/tags?post=869"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}