{"id":462,"date":"2023-07-29T20:10:11","date_gmt":"2023-07-29T20:10:11","guid":{"rendered":"https:\/\/statorials.org\/it\/regressione-multicollinearita\/"},"modified":"2023-07-29T20:10:11","modified_gmt":"2023-07-29T20:10:11","slug":"regressione-multicollinearita","status":"publish","type":"post","link":"https:\/\/statorials.org\/it\/regressione-multicollinearita\/","title":{"rendered":"Una guida alla multicollinearit\u00e0 e al vif nella regressione"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\"><strong>La multicollinearit\u00e0<\/strong> nell&#8217;analisi di regressione si verifica quando due o pi\u00f9 variabili predittive sono altamente correlate tra loro, in modo tale da non fornire informazioni univoche o indipendenti nel modello di regressione.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Se il grado di correlazione tra le variabili \u00e8 sufficientemente elevato, ci\u00f2 pu\u00f2 causare problemi durante l&#8217;adattamento e l&#8217;interpretazione del modello di regressione.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Ad esempio, supponiamo di eseguire un&#8217;analisi di regressione utilizzando la <a href=\"https:\/\/statorials.org\/it\/variabili-risposte-esplicative\/\" target=\"_blank\" rel=\"noopener noreferrer\">variabile di risposta<\/a> <em>al salto verticale massimo<\/em> e le seguenti variabili predittive:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">altezza<\/span><\/li>\n<li> <span style=\"color: #000000;\">taglia di scarpe<\/span><\/li>\n<li> <span style=\"color: #000000;\">ore trascorse a esercitarsi al giorno<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">In questo caso, <em>l\u2019altezza<\/em> e <em>il numero di scarpe<\/em> sono probabilmente altamente correlati, poich\u00e9 le persone pi\u00f9 alte tendono ad avere numeri di scarpe pi\u00f9 grandi. Ci\u00f2 significa che \u00e8 probabile che la multicollinearit\u00e0 costituisca un problema in questa regressione.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Questo tutorial spiega perch\u00e9 la multicollinearit\u00e0 \u00e8 un problema, come rilevarla e come risolverla.<\/span><\/p>\n<h2> <span style=\"color: #000000;\"><strong>Perch\u00e9 la multicollinearit\u00e0 \u00e8 un problema<\/strong><\/span><\/h2>\n<p> <span style=\"color: #000000;\">Uno degli obiettivi principali dell&#8217;analisi di regressione \u00e8 isolare la relazione tra ciascuna variabile predittrice e la variabile di risposta.<\/span><\/p>\n<p> <span style=\"color: #000000;\">In particolare, quando eseguiamo l&#8217;analisi di regressione, interpretiamo ciascun coefficiente di regressione come la variazione media nella variabile di risposta, <em>presupponendo che tutte le altre variabili predittive nel modello rimangano costanti.<\/em><\/span><\/p>\n<p> <span style=\"color: #000000;\">Ci\u00f2 significa che assumiamo di essere in grado di modificare i valori di una determinata variabile predittrice senza modificare i valori di altre variabili predittive.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Tuttavia, quando due o pi\u00f9 variabili predittive sono altamente correlate, diventa difficile modificare una variabile senza modificarne un\u2019altra.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Ci\u00f2 rende difficile per il modello di regressione stimare in modo indipendente la relazione tra ciascuna variabile predittiva e la variabile di risposta, poich\u00e9 le variabili predittive tendono a cambiare all&#8217;unisono.<\/span><\/p>\n<p> <span style=\"color: #000000;\">In generale, la multicollinearit\u00e0 pone due tipi di problemi:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Le stime dei coefficienti del modello (e anche i segni dei coefficienti) possono variare considerevolmente a seconda delle altre variabili predittive incluse nel modello.<\/span><\/li>\n<li> <span style=\"color: #000000;\">La precisione delle stime dei coefficienti \u00e8 ridotta, rendendo i valori p inaffidabili. Ci\u00f2 rende difficile determinare quali variabili predittive siano effettivamente statisticamente significative.<\/span><\/li>\n<\/ul>\n<h2> <strong><span style=\"color: #000000;\">Come rilevare la multicollinearit\u00e0<\/span><\/strong><\/h2>\n<p> <span style=\"color: #000000;\">Il modo pi\u00f9 comune per rilevare la multicollinearit\u00e0 \u00e8 utilizzare il <strong>fattore di inflazione della varianza (VIF)<\/strong> , che misura la correlazione e la forza della correlazione tra le variabili predittive in un modello di regressione.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Utilizzo del fattore di inflazione della varianza (VIF)<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">La maggior parte dei software statistici \u00e8 in grado di calcolare il VIF per un modello di regressione. Il valore VIF inizia da 1 e non ha un limite superiore. Una regola generale per interpretare i VIF \u00e8:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Un valore pari a 1 indica che non esiste alcuna correlazione tra una determinata variabile predittore e qualsiasi altra variabile predittore nel modello.<\/span><\/li>\n<li> <span style=\"color: #000000;\">Un valore compreso tra 1 e 5 indica una correlazione moderata tra una determinata variabile predittiva e altre variabili predittive nel modello, ma spesso non \u00e8 abbastanza grave da richiedere un&#8217;attenzione speciale.<\/span><\/li>\n<li> <span style=\"color: #000000;\">Un valore maggiore di 5 indica una correlazione potenzialmente seria tra una determinata variabile predittrice e altre variabili predittive nel modello. In questo caso, le stime dei coefficienti e i valori p nei risultati della regressione sono probabilmente inaffidabili.<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Ad esempio, supponiamo di eseguire un&#8217;analisi di regressione utilizzando le variabili predittive <em>altezza<\/em> , <em>numero di scarpe<\/em> e <em>ore trascorse ad allenarsi ogni giorno<\/em> per prevedere <em>il salto verticale massimo<\/em> dei giocatori di basket e ricevere il seguente risultato:<\/span><\/p>\n<p> <span style=\"color: #000000;\">Nell&#8217;ultima colonna, possiamo vedere che i valori VIF per <em>l&#8217;altezza<\/em> e <em>il numero di scarpe<\/em> sono entrambi maggiori di 5. Ci\u00f2 indica che probabilmente soffrono di multicollinearit\u00e0 e che le loro stime dei coefficienti e i valori p sono probabilmente inaffidabili.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Se osserviamo la stima del coefficiente per la misura della scarpa, il modello ci dice che per ogni unit\u00e0 aggiuntiva di aumento della misura della scarpa, l&#8217;aumento medio del <em>salto verticale massimo<\/em> \u00e8 di -0,67498 pollici, assumendo che l&#8217;altezza e le ore di pratica rimangano costanti.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Questo non sembra avere senso, dato che ci aspetteremmo che i giocatori con scarpe pi\u00f9 grandi siano pi\u00f9 alti e quindi abbiano un salto verticale massimo pi\u00f9 alto.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Questo \u00e8 un classico esempio di multicollinearit\u00e0 che fa sembrare le stime dei coefficienti un po\u2019 inverosimili e poco intuitive.<\/span><\/p>\n<h2> <strong><span style=\"color: #000000;\">Come risolvere la multicollinearit\u00e0<\/span><\/strong><\/h2>\n<p> <span style=\"color: #000000;\">Se rilevi la multicollinearit\u00e0, il passo successivo \u00e8 decidere se \u00e8 necessario risolverla in qualche modo. A seconda dell&#8217;obiettivo dell&#8217;analisi di regressione, potrebbe non essere necessario risolvere la multicollinearit\u00e0.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Sapere:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>1.<\/strong> Se \u00e8 presente solo una moderata collinearit\u00e0, probabilmente non sar\u00e0 necessario risolverla in alcun modo.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>2.<\/strong> La multicollinearit\u00e0 influisce solo sulle variabili predittive correlate tra loro. Se sei interessato a una variabile predittrice nel modello che non soffre di multicollinearit\u00e0, allora la multicollinearit\u00e0 non \u00e8 un problema.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>3.<\/strong> La multicollinearit\u00e0 influisce sulle stime dei coefficienti e sui valori p, ma non influisce sulle previsioni o sulle statistiche della bont\u00e0 di adattamento. Ci\u00f2 significa che se il tuo obiettivo principale con la regressione \u00e8 fare previsioni e non sei interessato a comprendere l&#8217;esatta relazione tra le variabili predittive e la variabile di risposta, non \u00e8 necessario risolvere la multicollinearit\u00e0.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Se si determina che \u00e8 <em>necessario<\/em> correggere la multicollinearit\u00e0, alcune soluzioni comuni includono:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>1. Rimuovere una o pi\u00f9 variabili altamente correlate.<\/strong> Questa \u00e8 la soluzione pi\u00f9 rapida nella maggior parte dei casi ed \u00e8 spesso una soluzione accettabile perch\u00e9 le variabili rimosse sono comunque ridondanti e aggiungono poche informazioni univoche o indipendenti al modello.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>2. Combina linearmente le variabili predittive in qualche modo, ad esempio aggiungendole o sottraendole in qualche modo.<\/strong> In questo modo, puoi creare una nuova variabile che comprende le informazioni di entrambe le variabili e non avrai pi\u00f9 problemi di multicollinearit\u00e0.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>3. Eseguire un&#8217;analisi progettata per tenere conto di variabili altamente correlate, come <a href=\"https:\/\/statorials.org\/it\/analisi-delle-componenti-principali-in-r\/\" target=\"_blank\" rel=\"noopener noreferrer\">l&#8217;analisi delle componenti principali<\/a> o <a href=\"https:\/\/statorials.org\/it\/minimi-quadrati-parziali\/\" target=\"_blank\" rel=\"noopener noreferrer\">la regressione dei minimi quadrati parziali (PLS)<\/a> .<\/strong> Queste tecniche sono progettate specificamente per gestire variabili predittive altamente correlate.<\/span><\/p>\n","protected":false},"excerpt":{"rendered":"<p>La multicollinearit\u00e0 nell&#8217;analisi di regressione si verifica quando due o pi\u00f9 variabili predittive sono altamente correlate tra loro, in modo tale da non fornire informazioni univoche o indipendenti nel modello di regressione. Se il grado di correlazione tra le variabili \u00e8 sufficientemente elevato, ci\u00f2 pu\u00f2 causare problemi durante l&#8217;adattamento e l&#8217;interpretazione del modello di regressione. [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Una guida alla multicollinearit\u00e0 e al VIF nella regressione - Statorials<\/title>\n<meta name=\"description\" content=\"Questo tutorial spiega perch\u00e9 la multicollinearit\u00e0 \u00e8 un problema nell&#039;analisi di regressione, come rilevarla e come risolverla.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/it\/regressione-multicollinearita\/\" \/>\n<meta property=\"og:locale\" content=\"it_IT\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Una guida alla multicollinearit\u00e0 e al VIF nella regressione - Statorials\" \/>\n<meta property=\"og:description\" content=\"Questo tutorial spiega perch\u00e9 la multicollinearit\u00e0 \u00e8 un problema nell&#039;analisi di regressione, come rilevarla e come risolverla.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/it\/regressione-multicollinearita\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-29T20:10:11+00:00\" \/>\n<meta name=\"author\" content=\"Benjamin anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Written by\" \/>\n\t<meta name=\"twitter:data1\" content=\"Benjamin anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Est. reading time\" \/>\n\t<meta name=\"twitter:data2\" content=\"5 minuti\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/it\/regressione-multicollinearita\/\",\"url\":\"https:\/\/statorials.org\/it\/regressione-multicollinearita\/\",\"name\":\"Una guida alla multicollinearit\u00e0 e al VIF nella regressione - Statorials\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/it\/#website\"},\"datePublished\":\"2023-07-29T20:10:11+00:00\",\"dateModified\":\"2023-07-29T20:10:11+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/it\/#\/schema\/person\/0896f191fb9fb019f2cd8623112cb3ae\"},\"description\":\"Questo tutorial spiega perch\u00e9 la multicollinearit\u00e0 \u00e8 un problema nell&#39;analisi di regressione, come rilevarla e come risolverla.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/it\/regressione-multicollinearita\/#breadcrumb\"},\"inLanguage\":\"it-IT\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/it\/regressione-multicollinearita\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/it\/regressione-multicollinearita\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Casa\",\"item\":\"https:\/\/statorials.org\/it\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Una guida alla multicollinearit\u00e0 e al vif nella regressione\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/it\/#website\",\"url\":\"https:\/\/statorials.org\/it\/\",\"name\":\"Statorials\",\"description\":\"La tua guida all&#039;alfabetizzazione statistica!\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/it\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"it-IT\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/it\/#\/schema\/person\/0896f191fb9fb019f2cd8623112cb3ae\",\"name\":\"Benjamin anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"it-IT\",\"@id\":\"https:\/\/statorials.org\/it\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/statorials.org\/it\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"https:\/\/statorials.org\/it\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"caption\":\"Benjamin anderson\"},\"description\":\"Ciao, sono Benjamin, un professore di statistica in pensione diventato insegnante dedicato di Statorials. Con una vasta esperienza e competenza nel campo della statistica, sono ansioso di condividere le mie conoscenze per potenziare gli studenti attraverso Statorials. Scopri di pi\u00f9\",\"sameAs\":[\"https:\/\/statorials.org\/it\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Una guida alla multicollinearit\u00e0 e al VIF nella regressione - Statorials","description":"Questo tutorial spiega perch\u00e9 la multicollinearit\u00e0 \u00e8 un problema nell&#39;analisi di regressione, come rilevarla e come risolverla.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/it\/regressione-multicollinearita\/","og_locale":"it_IT","og_type":"article","og_title":"Una guida alla multicollinearit\u00e0 e al VIF nella regressione - Statorials","og_description":"Questo tutorial spiega perch\u00e9 la multicollinearit\u00e0 \u00e8 un problema nell&#39;analisi di regressione, come rilevarla e come risolverla.","og_url":"https:\/\/statorials.org\/it\/regressione-multicollinearita\/","og_site_name":"Statorials","article_published_time":"2023-07-29T20:10:11+00:00","author":"Benjamin anderson","twitter_card":"summary_large_image","twitter_misc":{"Written by":"Benjamin anderson","Est. reading time":"5 minuti"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/it\/regressione-multicollinearita\/","url":"https:\/\/statorials.org\/it\/regressione-multicollinearita\/","name":"Una guida alla multicollinearit\u00e0 e al VIF nella regressione - Statorials","isPartOf":{"@id":"https:\/\/statorials.org\/it\/#website"},"datePublished":"2023-07-29T20:10:11+00:00","dateModified":"2023-07-29T20:10:11+00:00","author":{"@id":"https:\/\/statorials.org\/it\/#\/schema\/person\/0896f191fb9fb019f2cd8623112cb3ae"},"description":"Questo tutorial spiega perch\u00e9 la multicollinearit\u00e0 \u00e8 un problema nell&#39;analisi di regressione, come rilevarla e come risolverla.","breadcrumb":{"@id":"https:\/\/statorials.org\/it\/regressione-multicollinearita\/#breadcrumb"},"inLanguage":"it-IT","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/it\/regressione-multicollinearita\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/it\/regressione-multicollinearita\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Casa","item":"https:\/\/statorials.org\/it\/"},{"@type":"ListItem","position":2,"name":"Una guida alla multicollinearit\u00e0 e al vif nella regressione"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/it\/#website","url":"https:\/\/statorials.org\/it\/","name":"Statorials","description":"La tua guida all&#039;alfabetizzazione statistica!","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/it\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"it-IT"},{"@type":"Person","@id":"https:\/\/statorials.org\/it\/#\/schema\/person\/0896f191fb9fb019f2cd8623112cb3ae","name":"Benjamin anderson","image":{"@type":"ImageObject","inLanguage":"it-IT","@id":"https:\/\/statorials.org\/it\/#\/schema\/person\/image\/","url":"https:\/\/statorials.org\/it\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","contentUrl":"https:\/\/statorials.org\/it\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","caption":"Benjamin anderson"},"description":"Ciao, sono Benjamin, un professore di statistica in pensione diventato insegnante dedicato di Statorials. Con una vasta esperienza e competenza nel campo della statistica, sono ansioso di condividere le mie conoscenze per potenziare gli studenti attraverso Statorials. Scopri di pi\u00f9","sameAs":["https:\/\/statorials.org\/it"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/posts\/462"}],"collection":[{"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/comments?post=462"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/posts\/462\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/media?parent=462"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/categories?post=462"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/tags?post=462"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}