{"id":504,"date":"2023-07-29T16:45:15","date_gmt":"2023-07-29T16:45:15","guid":{"rendered":"https:\/\/statorials.org\/it\/fattore-di-inflazione-della-varianza-r\/"},"modified":"2023-07-29T16:45:15","modified_gmt":"2023-07-29T16:45:15","slug":"fattore-di-inflazione-della-varianza-r","status":"publish","type":"post","link":"https:\/\/statorials.org\/it\/fattore-di-inflazione-della-varianza-r\/","title":{"rendered":"Come calcolare il fattore di inflazione della varianza (vif) in r"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\">La multicollinearit\u00e0 nell&#8217;analisi di regressione si verifica quando due o pi\u00f9 variabili predittive sono altamente correlate tra loro, in modo tale da non fornire informazioni univoche o indipendenti nel modello di regressione.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Se il grado di correlazione tra le variabili \u00e8 sufficientemente elevato, ci\u00f2 pu\u00f2 causare problemi durante l&#8217;adattamento e l&#8217;interpretazione del modello di regressione .<\/span><\/p>\n<p> <span style=\"color: #000000;\">Il modo pi\u00f9 comune per rilevare la multicollinearit\u00e0 \u00e8 utilizzare il fattore di inflazione della varianza (VIF), che misura la <a href=\"https:\/\/statorials.org\/it\/coefficiente-di-correlazione-di-pearson-1\/\" target=\"_blank\" rel=\"noopener\">correlazione<\/a> e la forza della correlazione tra le variabili predittive in un modello di regressione.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Il valore VIF inizia da 1 e non ha un limite superiore. Una regola generale per interpretare i VIF \u00e8:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Un valore pari a 1 indica che non esiste alcuna correlazione tra una determinata variabile predittore e qualsiasi altra variabile predittore nel modello.<\/span><\/li>\n<li> <span style=\"color: #000000;\">Un valore compreso tra 1 e 5 indica una correlazione moderata tra una determinata variabile predittiva e altre variabili predittive nel modello, ma spesso non \u00e8 abbastanza grave da richiedere un&#8217;attenzione speciale.<\/span><\/li>\n<li> <span style=\"color: #000000;\">Un valore maggiore di 5 indica una correlazione potenzialmente seria tra una determinata variabile predittrice e altre variabili predittive nel modello. In questo caso, le stime dei coefficienti e i valori p nei risultati della regressione sono probabilmente inaffidabili.<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Si noti che ci sono alcuni casi in cui valori VIF elevati <a href=\"https:\/\/statisticalhorizons.com\/multicollinearity\" target=\"_blank\" rel=\"noopener\">possono essere tranquillamente ignorati<\/a> .<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Come calcolare il VIF in R<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Per illustrare come calcolare VIF per un modello di regressione in R, utilizzeremo il set di dati <em>mtcars<\/em> integrato:<\/span><\/p>\n<pre style=\"background-color: #e5e5e5; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#view first six lines of <em>mtcars<\/em><\/span>\nhead(mtcars)\n\n# mpg cyl disp hp drat wt qsec vs am gear carb\n#Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4\n#Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4\n#Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1\n#Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1\n#Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2\n#Valiant 18.1 6 225 105 2.76 3.460 20.22 1 0 3 1<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Innanzitutto, adatteremo un modello di regressione utilizzando <em>mpg<\/em> come variabile di risposta e <em>disp<\/em> , <em>hp<\/em> , <em>wt<\/em> e <em>drat<\/em> come variabili predittive:<\/span><\/p>\n<pre style=\"background-color: #e5e5e5; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#fit the regression model<\/span>\nmodel &lt;- lm(mpg ~ disp + hp + wt + drat, data = mtcars)\n\n<span style=\"color: #008080;\">#view the output of the regression model\n<\/span>summary(model)\n\n#Call:\n#lm(formula = mpg ~ disp + hp + wt + drat, data = mtcars)\n#\n#Residuals:\n# Min 1Q Median 3Q Max \n#-3.5077 -1.9052 -0.5057 0.9821 5.6883 \n#\n#Coefficients:\n#Estimate Std. Error t value Pr(&gt;|t|)    \n#(Intercept) 29.148738 6.293588 4.631 8.2e-05 ***\n#available 0.003815 0.010805 0.353 0.72675    \n#hp -0.034784 0.011597 -2.999 0.00576 ** \n#wt -3.479668 1.078371 -3.227 0.00327 ** \n#drat 1.768049 1.319779 1.340 0.19153    \n#---\n#Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1\n#\n#Residual standard error: 2.602 on 27 degrees of freedom\n#Multiple R-squared: 0.8376, Adjusted R-squared: 0.8136 \n#F-statistic: 34.82 on 4 and 27 DF, p-value: 2.704e-10\n<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Possiamo vedere dal risultato che il valore R quadrato del modello \u00e8 <strong>0,8376<\/strong> . Possiamo anche vedere che <a href=\"https:\/\/statorials.org\/it\/una-semplice-guida-per-comprendere-il-test-f-per-la-significativita-complessiva-nella-regressione\/\" target=\"_blank\" rel=\"noopener\">la statistica F complessiva<\/a> \u00e8 <strong>34,82<\/strong> e il corrispondente valore p \u00e8 <strong>2,704e-10<\/strong> , il che indica che il modello di regressione complessivo \u00e8 significativo. Inoltre,<\/span> <span style=\"color: #000000;\">le variabili predittive <em>hp<\/em> e <em>wt<\/em> sono statisticamente significative al livello di significativit\u00e0 0,05, mentre <em>disp<\/em> e <em>drat<\/em> non lo sono.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Successivamente, utilizzeremo la funzione <strong>vive()<\/strong> della libreria <strong>per<\/strong> calcolare il VIF per ciascuna variabile predittrice nel modello:<\/span><\/p>\n<pre style=\"background-color: #e5e5e5; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#load the <em>car<\/em> library<\/span>\nlibrary(car)\n\n<span style=\"color: #008080;\">#calculate the VIF for each predictor variable in the model\n<\/span>lively(model)\n\n# disp hp wt drat \n#8.209402 2.894373 5.096601 2.279547 \n<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Possiamo vedere che i VIF per <em>disp<\/em> e <em>wt<\/em> sono maggiori di 5, il che \u00e8 potenzialmente preoccupante.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Visualizzazione dei valori VIF<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Per visualizzare i valori VIF per ciascuna variabile predittrice, possiamo creare un semplice grafico a barre orizzontali e aggiungere una linea verticale su 5 in modo da poter vedere chiaramente quali valori VIF superano 5:<\/span><\/p>\n<pre style=\"background-color: #e5e5e5; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#create vector of VIF values<\/span>\nvive_values &lt;- vive(model)\n\n<span style=\"color: #008080;\">#create horizontal bar chart to display each VIF value\n<\/span>barplot(vif_values, main = \"VIF Values\", horiz = TRUE, col = \"steelblue\")\n\n<span style=\"color: #008080;\">#add vertical line at 5\n<\/span>abline(v = 5, lwd = 3, lty = 2)<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Tieni presente che questo tipo di grafico sarebbe molto utile per un modello con molte variabili predittive, quindi possiamo visualizzare facilmente tutti i valori VIF contemporaneamente. Tuttavia, \u00e8 un grafico utile in questo esempio.<\/span><\/p>\n<p> <span style=\"color: #000000;\">A seconda del valore VIF che ritieni troppo alto per essere incluso nel modello, puoi scegliere di rimuovere alcune variabili predittive e vedere se il valore R quadrato corrispondente o l&#8217;errore standard del modello sono interessati.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Visualizzazione delle correlazioni tra variabili predittive<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Per comprendere meglio il motivo per cui una variabile predittrice potrebbe avere un valore VIF elevato, possiamo creare una matrice di correlazione per visualizzare i coefficienti di correlazione lineare tra ciascuna coppia di variabili:<\/span><\/p>\n<pre style=\"background-color: #e5e5e5; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#define the variables we want to include in the correlation matrix<\/span>\ndata &lt;- mtcars[, c(\"disp\", \"hp\", \"wt\", \"drat\")]\n\n<span style=\"color: #008080;\">#create correlation matrix<\/span>\ncor(data)\n\n# disp hp wt drat\n#available 1.0000000 0.7909486 0.8879799 -0.7102139\n#hp 0.7909486 1.0000000 0.6587479 -0.4487591\n#wt 0.8879799 0.6587479 1.0000000 -0.7124406\n#drat -0.7102139 -0.4487591 -0.7124406 1.0000000\n<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Ricordiamo che la variabile <em>disp<\/em> aveva un valore VIF maggiore di 8, che era il valore VIF pi\u00f9 alto tra tutte le variabili predittive nel modello. Dalla matrice di correlazione possiamo vedere che <em>disp<\/em> \u00e8 altamente correlato con le altre tre variabili predittive, il che spiega perch\u00e9 il suo valore VIF \u00e8 cos\u00ec alto.<\/span><\/p>\n<p> <span style=\"color: #000000;\">In questo caso, potresti voler rimuovere <em>disp<\/em> dal modello perch\u00e9 il suo valore VIF \u00e8 elevato <em>e<\/em> non \u00e8 statisticamente significativo al livello di significativit\u00e0 0,05.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Tieni presente che una matrice di correlazione e un VIF ti forniranno informazioni simili: entrambi ti dicono quando una variabile \u00e8 altamente correlata con una o pi\u00f9 altre variabili in un modello di regressione.<\/span><\/p>\n<p> <strong><span style=\"color: #000000;\">Ulteriori letture:<\/span><\/strong><br \/> <strong>Una guida alla multicollinearit\u00e0 e al VIF nella regressione<br \/> Qual \u00e8 un buon valore R quadrato?<\/strong><\/p>\n","protected":false},"excerpt":{"rendered":"<p>La multicollinearit\u00e0 nell&#8217;analisi di regressione si verifica quando due o pi\u00f9 variabili predittive sono altamente correlate tra loro, in modo tale da non fornire informazioni univoche o indipendenti nel modello di regressione. Se il grado di correlazione tra le variabili \u00e8 sufficientemente elevato, ci\u00f2 pu\u00f2 causare problemi durante l&#8217;adattamento e l&#8217;interpretazione del modello di regressione [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Come calcolare il fattore di inflazione della varianza (VIF) in R - Stology<\/title>\n<meta name=\"description\" content=\"Questo tutorial spiega come calcolare VIF in R, una metrica che pu\u00f2 essere utilizzata per rilevare la multicollinearit\u00e0 in un modello di regressione.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/it\/fattore-di-inflazione-della-varianza-r\/\" \/>\n<meta property=\"og:locale\" content=\"it_IT\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Come calcolare il fattore di inflazione della varianza (VIF) in R - Stology\" \/>\n<meta property=\"og:description\" content=\"Questo tutorial spiega come calcolare VIF in R, una metrica che pu\u00f2 essere utilizzata per rilevare la multicollinearit\u00e0 in un modello di regressione.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/it\/fattore-di-inflazione-della-varianza-r\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-29T16:45:15+00:00\" \/>\n<meta name=\"author\" content=\"Benjamin anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Written by\" \/>\n\t<meta name=\"twitter:data1\" content=\"Benjamin anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Est. reading time\" \/>\n\t<meta name=\"twitter:data2\" content=\"4 minuti\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/it\/fattore-di-inflazione-della-varianza-r\/\",\"url\":\"https:\/\/statorials.org\/it\/fattore-di-inflazione-della-varianza-r\/\",\"name\":\"Come calcolare il fattore di inflazione della varianza (VIF) in R - Stology\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/it\/#website\"},\"datePublished\":\"2023-07-29T16:45:15+00:00\",\"dateModified\":\"2023-07-29T16:45:15+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/it\/#\/schema\/person\/0896f191fb9fb019f2cd8623112cb3ae\"},\"description\":\"Questo tutorial spiega come calcolare VIF in R, una metrica che pu\u00f2 essere utilizzata per rilevare la multicollinearit\u00e0 in un modello di regressione.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/it\/fattore-di-inflazione-della-varianza-r\/#breadcrumb\"},\"inLanguage\":\"it-IT\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/it\/fattore-di-inflazione-della-varianza-r\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/it\/fattore-di-inflazione-della-varianza-r\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Casa\",\"item\":\"https:\/\/statorials.org\/it\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Come calcolare il fattore di inflazione della varianza (vif) in r\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/it\/#website\",\"url\":\"https:\/\/statorials.org\/it\/\",\"name\":\"Statorials\",\"description\":\"La tua guida all&#039;alfabetizzazione statistica!\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/it\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"it-IT\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/it\/#\/schema\/person\/0896f191fb9fb019f2cd8623112cb3ae\",\"name\":\"Benjamin anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"it-IT\",\"@id\":\"https:\/\/statorials.org\/it\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/statorials.org\/it\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"https:\/\/statorials.org\/it\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"caption\":\"Benjamin anderson\"},\"description\":\"Ciao, sono Benjamin, un professore di statistica in pensione diventato insegnante dedicato di Statorials. Con una vasta esperienza e competenza nel campo della statistica, sono ansioso di condividere le mie conoscenze per potenziare gli studenti attraverso Statorials. Scopri di pi\u00f9\",\"sameAs\":[\"https:\/\/statorials.org\/it\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Come calcolare il fattore di inflazione della varianza (VIF) in R - Stology","description":"Questo tutorial spiega come calcolare VIF in R, una metrica che pu\u00f2 essere utilizzata per rilevare la multicollinearit\u00e0 in un modello di regressione.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/it\/fattore-di-inflazione-della-varianza-r\/","og_locale":"it_IT","og_type":"article","og_title":"Come calcolare il fattore di inflazione della varianza (VIF) in R - Stology","og_description":"Questo tutorial spiega come calcolare VIF in R, una metrica che pu\u00f2 essere utilizzata per rilevare la multicollinearit\u00e0 in un modello di regressione.","og_url":"https:\/\/statorials.org\/it\/fattore-di-inflazione-della-varianza-r\/","og_site_name":"Statorials","article_published_time":"2023-07-29T16:45:15+00:00","author":"Benjamin anderson","twitter_card":"summary_large_image","twitter_misc":{"Written by":"Benjamin anderson","Est. reading time":"4 minuti"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/it\/fattore-di-inflazione-della-varianza-r\/","url":"https:\/\/statorials.org\/it\/fattore-di-inflazione-della-varianza-r\/","name":"Come calcolare il fattore di inflazione della varianza (VIF) in R - Stology","isPartOf":{"@id":"https:\/\/statorials.org\/it\/#website"},"datePublished":"2023-07-29T16:45:15+00:00","dateModified":"2023-07-29T16:45:15+00:00","author":{"@id":"https:\/\/statorials.org\/it\/#\/schema\/person\/0896f191fb9fb019f2cd8623112cb3ae"},"description":"Questo tutorial spiega come calcolare VIF in R, una metrica che pu\u00f2 essere utilizzata per rilevare la multicollinearit\u00e0 in un modello di regressione.","breadcrumb":{"@id":"https:\/\/statorials.org\/it\/fattore-di-inflazione-della-varianza-r\/#breadcrumb"},"inLanguage":"it-IT","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/it\/fattore-di-inflazione-della-varianza-r\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/it\/fattore-di-inflazione-della-varianza-r\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Casa","item":"https:\/\/statorials.org\/it\/"},{"@type":"ListItem","position":2,"name":"Come calcolare il fattore di inflazione della varianza (vif) in r"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/it\/#website","url":"https:\/\/statorials.org\/it\/","name":"Statorials","description":"La tua guida all&#039;alfabetizzazione statistica!","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/it\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"it-IT"},{"@type":"Person","@id":"https:\/\/statorials.org\/it\/#\/schema\/person\/0896f191fb9fb019f2cd8623112cb3ae","name":"Benjamin anderson","image":{"@type":"ImageObject","inLanguage":"it-IT","@id":"https:\/\/statorials.org\/it\/#\/schema\/person\/image\/","url":"https:\/\/statorials.org\/it\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","contentUrl":"https:\/\/statorials.org\/it\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","caption":"Benjamin anderson"},"description":"Ciao, sono Benjamin, un professore di statistica in pensione diventato insegnante dedicato di Statorials. Con una vasta esperienza e competenza nel campo della statistica, sono ansioso di condividere le mie conoscenze per potenziare gli studenti attraverso Statorials. Scopri di pi\u00f9","sameAs":["https:\/\/statorials.org\/it"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/posts\/504"}],"collection":[{"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/comments?post=504"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/posts\/504\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/media?parent=504"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/categories?post=504"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/tags?post=504"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}