{"id":504,"date":"2023-07-29T16:45:15","date_gmt":"2023-07-29T16:45:15","guid":{"rendered":"https:\/\/statorials.org\/nl\/variantie-inflatiefactor-r\/"},"modified":"2023-07-29T16:45:15","modified_gmt":"2023-07-29T16:45:15","slug":"variantie-inflatiefactor-r","status":"publish","type":"post","link":"https:\/\/statorials.org\/nl\/variantie-inflatiefactor-r\/","title":{"rendered":"Hoe de variantie-inflatiefactor (vif) in r te berekenen"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\">Multicollineariteit bij regressieanalyse treedt op wanneer twee of meer voorspellende variabelen sterk met elkaar gecorreleerd zijn, zodat ze geen unieke of onafhankelijke informatie verschaffen in het regressiemodel.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Als de mate van correlatie tussen variabelen hoog genoeg is, kan dit problemen veroorzaken bij het aanpassen en interpreteren van het regressiemodel .<\/span><\/p>\n<p> <span style=\"color: #000000;\">De meest gebruikelijke manier om multicollineariteit te detecteren is het gebruik van de variantie-inflatiefactor (VIF), die de<a href=\"https:\/\/statorials.org\/nl\/pearson-correlatiecoefficient-1\/\" target=\"_blank\" rel=\"noopener\">correlatie<\/a> en sterkte van de correlatie tussen voorspellende variabelen in een regressiemodel meet.<\/span><\/p>\n<p> <span style=\"color: #000000;\">De VIF-waarde begint bij 1 en heeft geen bovengrens. Een algemene regel voor het interpreteren van VIF&#8217;s is:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Een waarde van 1 geeft aan dat er geen correlatie bestaat tussen een bepaalde voorspellende variabele en enige andere voorspellende variabele in het model.<\/span><\/li>\n<li> <span style=\"color: #000000;\">Een waarde tussen 1 en 5 duidt op een gematigde correlatie tussen een bepaalde voorspellende variabele en andere voorspellende variabelen in het model, maar deze is vaak niet ernstig genoeg om speciale aandacht te vereisen.<\/span><\/li>\n<li> <span style=\"color: #000000;\">Een waarde groter dan 5 duidt op een potentieel ernstige correlatie tussen een bepaalde voorspellende variabele en andere voorspellende variabelen in het model. In dit geval zijn de co\u00ebffici\u00ebntschattingen en p-waarden in de regressieresultaten waarschijnlijk onbetrouwbaar.<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Houd er rekening mee dat er enkele gevallen zijn waarin hoge VIF-waarden <a href=\"https:\/\/statisticalhorizons.com\/multicollinearity\" target=\"_blank\" rel=\"noopener\">veilig kunnen worden genegeerd<\/a> .<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Hoe VIF in R te berekenen<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Om te illustreren hoe VIF voor een regressiemodel in R kan worden berekend, zullen we de ingebouwde <em>mtcars-<\/em> dataset gebruiken:<\/span><\/p>\n<pre style=\"background-color: #e5e5e5; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#view first six lines of <em>mtcars<\/em><\/span>\nhead(mtcars)\n\n# mpg cyl disp hp drat wt qsec vs am gear carb\n#Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4\n#Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4\n#Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1\n#Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1\n#Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2\n#Valiant 18.1 6 225 105 2.76 3.460 20.22 1 0 3 1<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Eerst zullen we een regressiemodel passen met <em>mpg<\/em> als de responsvariabele en <em>disp<\/em> , <em>hp<\/em> , <em>wt<\/em> en <em>drat<\/em> als de voorspellende variabelen:<\/span><\/p>\n<pre style=\"background-color: #e5e5e5; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#fit the regression model<\/span>\nmodel &lt;- lm(mpg ~ disp + hp + wt + drat, data = mtcars)\n\n<span style=\"color: #008080;\">#view the output of the regression model\n<\/span>summary(model)\n\n#Call:\n#lm(formula = mpg ~ disp + hp + wt + drat, data = mtcars)\n#\n#Residuals:\n# Min 1Q Median 3Q Max \n#-3.5077 -1.9052 -0.5057 0.9821 5.6883 \n#\n#Coefficients:\n#Estimate Std. Error t value Pr(&gt;|t|)    \n#(Intercept) 29.148738 6.293588 4.631 8.2e-05 ***\n#available 0.003815 0.010805 0.353 0.72675    \n#hp -0.034784 0.011597 -2.999 0.00576 ** \n#wt -3.479668 1.078371 -3.227 0.00327 ** \n#drat 1.768049 1.319779 1.340 0.19153    \n#---\n#Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1\n#\n#Residual standard error: 2.602 on 27 degrees of freedom\n#Multiple R-squared: 0.8376, Adjusted R-squared: 0.8136 \n#F-statistic: 34.82 on 4 and 27 DF, p-value: 2.704e-10\n<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Uit het resultaat kunnen we zien dat de R-kwadraatwaarde van het model <strong>0,8376<\/strong> is. We kunnen ook zien dat <a href=\"https:\/\/statorials.org\/nl\/een-eenvoudige-gids-voor-het-begrijpen-van-de-f-toets-voor-de-algehele-significantie-bij-regressie\/\" target=\"_blank\" rel=\"noopener\">de totale F-statistiek<\/a> <strong>34,82<\/strong> is en de overeenkomstige p-waarde <strong>2,704e-10<\/strong> , wat aangeeft dat het algehele regressiemodel significant is. Bovendien<\/span> <span style=\"color: #000000;\">zijn de voorspellende variabelen <em>hp<\/em> en <em>wt<\/em> statistisch significant op het significantieniveau van 0,05, terwijl <em>disp<\/em> en <em>drat<\/em> dat niet zijn.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Vervolgens zullen we de <strong>vive()-<\/strong> functie van de bibliotheek gebruiken <strong>om<\/strong> de VIF voor elke voorspellende variabele in het model te berekenen:<\/span><\/p>\n<pre style=\"background-color: #e5e5e5; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#load the <em>car<\/em> library<\/span>\nlibrary(car)\n\n<span style=\"color: #008080;\">#calculate the VIF for each predictor variable in the model\n<\/span>lively(model)\n\n# disp hp wt drat \n#8.209402 2.894373 5.096601 2.279547 \n<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">We kunnen zien dat de VIF&#8217;s voor <em>disp<\/em> en <em>wt<\/em> groter zijn dan 5, wat mogelijk zorgwekkend is.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>VIF-waarden bekijken<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Om de VIF-waarden voor elke voorspellende variabele te visualiseren, kunnen we een eenvoudig horizontaal staafdiagram maken en een verticale lijn toevoegen bij 5, zodat we duidelijk kunnen zien welke VIF-waarden groter zijn dan 5:<\/span><\/p>\n<pre style=\"background-color: #e5e5e5; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#create vector of VIF values<\/span>\nvive_values &lt;- vive(model)\n\n<span style=\"color: #008080;\">#create horizontal bar chart to display each VIF value\n<\/span>barplot(vif_values, main = \"VIF Values\", horiz = TRUE, col = \"steelblue\")\n\n<span style=\"color: #008080;\">#add vertical line at 5\n<\/span>abline(v = 5, lwd = 3, lty = 2)<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Merk op dat dit type diagram het nuttigst zou zijn voor een model met veel voorspellende variabelen, zodat we gemakkelijk alle VIF-waarden in \u00e9\u00e9n keer kunnen bekijken. In dit voorbeeld is het echter een nuttig diagram.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Afhankelijk van welke VIF-waarde u te hoog vindt om in het model op te nemen, kunt u ervoor kiezen bepaalde voorspellende variabelen te verwijderen en te kijken of de overeenkomstige R-kwadraatwaarde of standaardfout van het model wordt be\u00efnvloed.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Visualiseren van correlaties tussen voorspellende variabelen<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Om beter te begrijpen waarom een voorspellende variabele een hoge VIF-waarde kan hebben, kunnen we een correlatiematrix maken om de lineaire correlatieco\u00ebffici\u00ebnten tussen elk paar variabelen weer te geven:<\/span><\/p>\n<pre style=\"background-color: #e5e5e5; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#define the variables we want to include in the correlation matrix<\/span>\ndata &lt;- mtcars[, c(\"disp\", \"hp\", \"wt\", \"drat\")]\n\n<span style=\"color: #008080;\">#create correlation matrix<\/span>\ncor(data)\n\n# disp hp wt drat\n#available 1.0000000 0.7909486 0.8879799 -0.7102139\n#hp 0.7909486 1.0000000 0.6587479 -0.4487591\n#wt 0.8879799 0.6587479 1.0000000 -0.7124406\n#drat -0.7102139 -0.4487591 -0.7124406 1.0000000\n<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Bedenk dat de <em>disp-<\/em> variabele een VIF-waarde had groter dan 8, wat de hoogste VIF-waarde was van alle voorspellende variabelen in het model. Uit de correlatiematrix kunnen we zien dat <em>disp<\/em> sterk gecorreleerd is met de andere drie voorspellende variabelen, wat verklaart waarom de VIF-waarde zo hoog is.<\/span><\/p>\n<p> <span style=\"color: #000000;\">In dit geval wilt u wellicht <em>disp<\/em> uit het model verwijderen, omdat de VIF-waarde hoog is <em>en<\/em> niet statistisch significant is op het significantieniveau van 0,05.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Merk op dat een correlatiematrix en een VIF u vergelijkbare informatie zullen verschaffen: ze vertellen u allebei wanneer een variabele sterk gecorreleerd is met een of meer andere variabelen in een regressiemodel.<\/span><\/p>\n<p> <strong><span style=\"color: #000000;\">Verder lezen:<\/span><\/strong><br \/> <strong>Een gids voor multicollineariteit en VIF in regressie<br \/> Wat is een goede R-kwadraatwaarde?<\/strong><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Multicollineariteit bij regressieanalyse treedt op wanneer twee of meer voorspellende variabelen sterk met elkaar gecorreleerd zijn, zodat ze geen unieke of onafhankelijke informatie verschaffen in het regressiemodel. Als de mate van correlatie tussen variabelen hoog genoeg is, kan dit problemen veroorzaken bij het aanpassen en interpreteren van het regressiemodel . De meest gebruikelijke manier om [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"class_list":["post-504","post","type-post","status-publish","format-standard","hentry","category-gids"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Hoe de variantie-inflatiefactor (VIF) in R te berekenen - Statorials<\/title>\n<meta name=\"description\" content=\"In deze tutorial wordt uitgelegd hoe u VIF in R kunt berekenen, een metriek die kan worden gebruikt om multicollineariteit in een regressiemodel te detecteren.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/nl\/variantie-inflatiefactor-r\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Hoe de variantie-inflatiefactor (VIF) in R te berekenen - Statorials\" \/>\n<meta property=\"og:description\" content=\"In deze tutorial wordt uitgelegd hoe u VIF in R kunt berekenen, een metriek die kan worden gebruikt om multicollineariteit in een regressiemodel te detecteren.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/nl\/variantie-inflatiefactor-r\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-29T16:45:15+00:00\" \/>\n<meta name=\"author\" content=\"Dr.benjamin anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"Dr.benjamin anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"4\u00a0Minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/nl\/variantie-inflatiefactor-r\/\",\"url\":\"https:\/\/statorials.org\/nl\/variantie-inflatiefactor-r\/\",\"name\":\"Hoe de variantie-inflatiefactor (VIF) in R te berekenen - Statorials\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/nl\/#website\"},\"datePublished\":\"2023-07-29T16:45:15+00:00\",\"dateModified\":\"2023-07-29T16:45:15+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\"},\"description\":\"In deze tutorial wordt uitgelegd hoe u VIF in R kunt berekenen, een metriek die kan worden gebruikt om multicollineariteit in een regressiemodel te detecteren.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/nl\/variantie-inflatiefactor-r\/#breadcrumb\"},\"inLanguage\":\"de\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/nl\/variantie-inflatiefactor-r\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/nl\/variantie-inflatiefactor-r\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Thuis\",\"item\":\"https:\/\/statorials.org\/nl\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Hoe de variantie-inflatiefactor (vif) in r te berekenen\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/nl\/#website\",\"url\":\"https:\/\/statorials.org\/nl\/\",\"name\":\"Statorials\",\"description\":\"Uw gids voor statistische competentie\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/nl\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"de\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\",\"name\":\"Dr.benjamin anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/\",\"url\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"caption\":\"Dr.benjamin anderson\"},\"description\":\"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder\",\"sameAs\":[\"http:\/\/statorials.org\/nl\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Hoe de variantie-inflatiefactor (VIF) in R te berekenen - Statorials","description":"In deze tutorial wordt uitgelegd hoe u VIF in R kunt berekenen, een metriek die kan worden gebruikt om multicollineariteit in een regressiemodel te detecteren.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/nl\/variantie-inflatiefactor-r\/","og_locale":"de_DE","og_type":"article","og_title":"Hoe de variantie-inflatiefactor (VIF) in R te berekenen - Statorials","og_description":"In deze tutorial wordt uitgelegd hoe u VIF in R kunt berekenen, een metriek die kan worden gebruikt om multicollineariteit in een regressiemodel te detecteren.","og_url":"https:\/\/statorials.org\/nl\/variantie-inflatiefactor-r\/","og_site_name":"Statorials","article_published_time":"2023-07-29T16:45:15+00:00","author":"Dr.benjamin anderson","twitter_card":"summary_large_image","twitter_misc":{"Verfasst von":"Dr.benjamin anderson","Gesch\u00e4tzte Lesezeit":"4\u00a0Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/nl\/variantie-inflatiefactor-r\/","url":"https:\/\/statorials.org\/nl\/variantie-inflatiefactor-r\/","name":"Hoe de variantie-inflatiefactor (VIF) in R te berekenen - Statorials","isPartOf":{"@id":"https:\/\/statorials.org\/nl\/#website"},"datePublished":"2023-07-29T16:45:15+00:00","dateModified":"2023-07-29T16:45:15+00:00","author":{"@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219"},"description":"In deze tutorial wordt uitgelegd hoe u VIF in R kunt berekenen, een metriek die kan worden gebruikt om multicollineariteit in een regressiemodel te detecteren.","breadcrumb":{"@id":"https:\/\/statorials.org\/nl\/variantie-inflatiefactor-r\/#breadcrumb"},"inLanguage":"de","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/nl\/variantie-inflatiefactor-r\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/nl\/variantie-inflatiefactor-r\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Thuis","item":"https:\/\/statorials.org\/nl\/"},{"@type":"ListItem","position":2,"name":"Hoe de variantie-inflatiefactor (vif) in r te berekenen"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/nl\/#website","url":"https:\/\/statorials.org\/nl\/","name":"Statorials","description":"Uw gids voor statistische competentie","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/nl\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"de"},{"@type":"Person","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219","name":"Dr.benjamin anderson","image":{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/","url":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","contentUrl":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","caption":"Dr.benjamin anderson"},"description":"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder","sameAs":["http:\/\/statorials.org\/nl"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/504","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/comments?post=504"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/504\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/media?parent=504"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/categories?post=504"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/tags?post=504"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}