{"id":476,"date":"2023-07-29T19:05:27","date_gmt":"2023-07-29T19:05:27","guid":{"rendered":"https:\/\/statorials.org\/it\/regressione-polinomiale-r\/"},"modified":"2023-07-29T19:05:27","modified_gmt":"2023-07-29T19:05:27","slug":"regressione-polinomiale-r","status":"publish","type":"post","link":"https:\/\/statorials.org\/it\/regressione-polinomiale-r\/","title":{"rendered":"Regressione polinomiale in r (passo dopo passo)"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\"><a href=\"https:\/\/statorials.org\/it\/regressione-polinomiale-1\/\" target=\"_blank\" rel=\"noopener noreferrer\">La regressione polinomiale<\/a> \u00e8 una tecnica che possiamo utilizzare quando la relazione tra una variabile predittore e una <a href=\"https:\/\/statorials.org\/it\/variabili-risposte-esplicative\/\" target=\"_blank\" rel=\"noopener noreferrer\">variabile di risposta<\/a> non \u00e8 lineare.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Questo tipo di regressione assume la forma:<\/span><\/p>\n<p> <span style=\"color: #000000;\">Y = \u03b2 <sub>0<\/sub> <sup>+<\/sup> \u03b2 <sub>1<\/sub> X + \u03b2 <sub>2<\/sub> X <sup>2<\/sup> + \u2026 + \u03b2 <sub>h<\/sub><\/span><\/p>\n<p> <span style=\"color: #000000;\">dove <em>h<\/em> \u00e8 il \u201cgrado\u201d del polinomio.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Questo tutorial fornisce un esempio passo passo di come eseguire la regressione polinomiale in R.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Passaggio 1: creare i dati<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Per questo esempio creeremo un dataset contenente il numero di ore studiate e il voto dell&#8217;esame finale per una classe di 50 studenti:<\/span><\/p>\n<pre style=\"background-color: #e5e5e5; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#make this example reproducible<\/span>\nset.seed(1)\n\n<span style=\"color: #008080;\">#create dataset\n<\/span>df &lt;- data.frame(hours = <span style=\"color: #3366ff;\">runif<\/span> (50, 5, 15), score=50)\ndf$score = df$score + df$hours^3\/150 + df$hours* <span style=\"color: #3366ff;\">runif<\/span> (50, 1, 2)\n\n<span style=\"color: #008080;\">#view first six rows of data\n<\/span>head(data)\n\n      hours score\n1 7.655087 64.30191\n2 8.721239 70.65430\n3 10.728534 73.66114\n4 14.082078 86.14630\n5 7.016819 59.81595\n6 13.983897 83.60510\n<\/strong><\/pre>\n<h3> <span style=\"color: #000000;\"><strong>Passaggio 2: visualizzare i dati<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Prima di adattare un modello di regressione ai dati, creiamo innanzitutto un grafico a dispersione per visualizzare la relazione tra le ore studiate e il punteggio dell&#8217;esame:<\/span> <\/p>\n<pre style=\"background-color: #e5e5e5; font-size: 15px;\"> <strong><span style=\"color: #993300;\">library<\/span> (ggplot2)\n\nggplot(df, <span style=\"color: #3366ff;\">aes<\/span> (x=hours, y=score)) +\n  geom_point()<\/strong> <\/pre>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-12001 \" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/poly1-1.png\" alt=\"\" width=\"457\" height=\"450\" srcset=\"\" sizes=\"\"><\/p>\n<p> <span style=\"color: #000000;\">Possiamo vedere che i dati hanno una relazione leggermente quadratica, indicando che la regressione polinomiale potrebbe adattarsi meglio ai dati rispetto alla semplice regressione lineare.<\/span><\/p>\n<h3> <strong><span style=\"color: #000000;\">Passaggio 3: adattamento dei modelli di regressione polinomiale<\/span><\/strong><\/h3>\n<p> <span style=\"color: #000000;\">Successivamente, adatteremo cinque diversi modelli di regressione polinomiale con gradi <em>h<\/em> = 1\u20265 e utilizzeremo la convalida incrociata k-fold con k = 10 volte per calcolare il test MSE per ciascun modello:<\/span><\/p>\n<pre style=\"background-color: #e5e5e5; font-size: 15px;\"> <span style=\"color: #000000;\"><strong><span style=\"color: #008080;\">#randomly shuffle data\n<\/span>df.shuffled &lt;- df[ <span style=\"color: #3366ff;\">sample<\/span> ( <span style=\"color: #3366ff;\">nrow<\/span> (df)),]\n\n<span style=\"color: #008080;\">#define number of folds to use for k-fold cross-validation\n<\/span>K &lt;- 10 \n\n<span style=\"color: #008080;\">#define degree of polynomials to fit\n<\/span>degree &lt;- 5\n\n<span style=\"color: #008080;\">#create k equal-sized folds\n<\/span>folds &lt;- cut( <span style=\"color: #3366ff;\">seq<\/span> (1, <span style=\"color: #3366ff;\">nrow<\/span> (df.shuffled)), breaks=K, labels= <span style=\"color: #008000;\">FALSE<\/span> )\n\n<span style=\"color: #008080;\">#create object to hold MSE's of models\n<\/span>mse = matrix(data=NA,nrow=K,ncol=degree)\n\n<span style=\"color: #008080;\">#Perform K-fold cross validation\n<\/span><span style=\"color: #008000;\">for<\/span> (i <span style=\"color: #008000;\">in<\/span> 1:K){\n    \n<span style=\"color: #008080;\">#define training and testing data\n<\/span>testIndexes &lt;- <span style=\"color: #3366ff;\">which<\/span> (folds==i,arr.ind= <span style=\"color: #008000;\">TRUE<\/span> )\n    testData &lt;- df.shuffled[testIndexes, ]\n    trainData &lt;- df.shuffled[-testIndexes, ]\n    \n<span style=\"color: #008080;\">#use k-fold cv to evaluate models\n<\/span>for (j in 1:degree){\n        fit.train = <span style=\"color: #3366ff;\">lm<\/span> (score ~ <span style=\"color: #3366ff;\">poly<\/span> (hours,d), data=trainData)\n        fit.test = <span style=\"color: #3366ff;\">predict<\/span> (fit.train, newdata=testData)\n        mse[i,j] = <span style=\"color: #3366ff;\">mean<\/span> ((fit.test-testData$score)^2) \n    }\n}\n\n<span style=\"color: #008080;\">#find MSE for each degree \n<\/span>colMeans(mse)\n\n[1] 9.802397 8.748666 9.601865 10.592569 13.545547\n<\/strong><\/span><\/pre>\n<p> <span style=\"color: #000000;\">Dal risultato possiamo vedere il test MSE per ciascun modello:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Test MSE con grado h=1: <strong>9,80<\/strong><\/span><\/li>\n<li> <span style=\"color: #000000;\">Prova MSE con grado h=2: <strong>8,75<\/strong><\/span><\/li>\n<li> <span style=\"color: #000000;\">Prova MSE con grado h=3: <strong>9,60<\/strong><\/span><\/li>\n<li> <span style=\"color: #000000;\">Prova MSE con grado h=4: <strong>10,59<\/strong><\/span><\/li>\n<li> <span style=\"color: #000000;\">Prova MSE con grado h=5: <strong>13,55<\/strong><\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Il modello con il test MSE pi\u00f9 basso si \u00e8 rivelato essere il modello di regressione polinomiale con grado <em>h<\/em> = 2.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Ci\u00f2 corrisponde alla nostra intuizione del grafico a dispersione originale: un modello di regressione quadratica si adatta meglio ai dati.<\/span><\/p>\n<h3> <strong><span style=\"color: #000000;\">Passaggio 4: analizzare il modello finale<\/span><\/strong><\/h3>\n<p> <span style=\"color: #000000;\">Infine possiamo ricavare i coefficienti del modello pi\u00f9 performante:<\/span><\/p>\n<pre style=\"background-color: #e5e5e5; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#fit best model<\/span>\nbest = <span style=\"color: #3366ff;\">lm<\/span> (score ~ <span style=\"color: #3366ff;\">poly<\/span> (hours,2, raw= <span style=\"color: #008000;\">T<\/span> ), data=df)\n\n<span style=\"color: #008080;\">#view summary of best model<\/span>\nsummary(best)\n\nCall:\nlm(formula = score ~ poly(hours, 2, raw = T), data = df)\n\nResiduals:\n    Min 1Q Median 3Q Max \n-5.6589 -2.0770 -0.4599 2.5923 4.5122 \n\nCoefficients:\n                         Estimate Std. Error t value Pr(&gt;|t|)    \n(Intercept) 54.00526 5.52855 9.768 6.78e-13 ***\npoly(hours, 2, raw = T)1 -0.07904 1.15413 -0.068 0.94569    \npoly(hours, 2, raw = T)2 0.18596 0.05724 3.249 0.00214 ** \n---\nSignificant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Dal risultato, possiamo vedere che il modello finale montato \u00e8:<\/span><\/p>\n<p> <span style=\"color: #000000;\">Punteggio = 54,00526 \u2013 0,07904*(ore) + 0,18596*(ore) <sup>2<\/sup><\/span><\/p>\n<p> <span style=\"color: #000000;\">Possiamo utilizzare questa equazione per stimare il punteggio che uno studente ricever\u00e0 in base al numero di ore studiate.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Ad esempio, uno studente che studia 10 ore dovrebbe ottenere un voto di <strong>71,81<\/strong> :<\/span><\/p>\n<p> <span style=\"color: #000000;\">Punteggio = 54,00526 \u2013 0,07904*(10) + 0,18596*(10) <sup>2<\/sup> = 71,81<\/span><\/p>\n<p> <span style=\"color: #000000;\">Possiamo anche tracciare il modello adattato per vedere quanto bene si adatta ai dati grezzi:<\/span> <\/p>\n<pre style=\"background-color: #e5e5e5; font-size: 15px;\"> <strong>ggplot(df, <span style=\"color: #3366ff;\">aes<\/span> (x=hours, y=score)) + \n          geom_point() +\n          stat_smooth(method=' <span style=\"color: #008000;\">lm<\/span> ', formula = y ~ <span style=\"color: #3366ff;\">poly<\/span> (x,2), size = 1) + \n          xlab(' <span style=\"color: #008000;\">Hours Studied<\/span> ') +\n          ylab(' <span style=\"color: #008000;\">Score<\/span> ')<\/strong> <\/pre>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-12002 \" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/poly2.png\" alt=\"Regressione polinomiale in R\" width=\"446\" height=\"449\" srcset=\"\" sizes=\"\"><\/p>\n<p> <span style=\"color: #000000;\">Puoi trovare il codice R completo utilizzato in questo esempio <a href=\"https:\/\/github.com\/Statorials\/R-Guides\/blob\/main\/polynomial_regression.R\" target=\"_blank\" rel=\"noopener noreferrer\">qui<\/a> .<\/span><\/p>\n","protected":false},"excerpt":{"rendered":"<p>La regressione polinomiale \u00e8 una tecnica che possiamo utilizzare quando la relazione tra una variabile predittore e una variabile di risposta non \u00e8 lineare. Questo tipo di regressione assume la forma: Y = \u03b2 0 + \u03b2 1 X + \u03b2 2 X 2 + \u2026 + \u03b2 h dove h \u00e8 il \u201cgrado\u201d del [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Regressione polinomiale in R (passo dopo passo) - Statorials<\/title>\n<meta name=\"description\" content=\"Questo tutorial fornisce una semplice guida per comprendere e implementare la regressione polinomiale in R, incluso un esempio.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/it\/regressione-polinomiale-r\/\" \/>\n<meta property=\"og:locale\" content=\"it_IT\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Regressione polinomiale in R (passo dopo passo) - Statorials\" \/>\n<meta property=\"og:description\" content=\"Questo tutorial fornisce una semplice guida per comprendere e implementare la regressione polinomiale in R, incluso un esempio.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/it\/regressione-polinomiale-r\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-29T19:05:27+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/poly1-1.png\" \/>\n<meta name=\"author\" content=\"Benjamin anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Written by\" \/>\n\t<meta name=\"twitter:data1\" content=\"Benjamin anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Est. reading time\" \/>\n\t<meta name=\"twitter:data2\" content=\"3 minuti\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/it\/regressione-polinomiale-r\/\",\"url\":\"https:\/\/statorials.org\/it\/regressione-polinomiale-r\/\",\"name\":\"Regressione polinomiale in R (passo dopo passo) - Statorials\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/it\/#website\"},\"datePublished\":\"2023-07-29T19:05:27+00:00\",\"dateModified\":\"2023-07-29T19:05:27+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/it\/#\/schema\/person\/0896f191fb9fb019f2cd8623112cb3ae\"},\"description\":\"Questo tutorial fornisce una semplice guida per comprendere e implementare la regressione polinomiale in R, incluso un esempio.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/it\/regressione-polinomiale-r\/#breadcrumb\"},\"inLanguage\":\"it-IT\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/it\/regressione-polinomiale-r\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/it\/regressione-polinomiale-r\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Casa\",\"item\":\"https:\/\/statorials.org\/it\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Regressione polinomiale in r (passo dopo passo)\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/it\/#website\",\"url\":\"https:\/\/statorials.org\/it\/\",\"name\":\"Statorials\",\"description\":\"La tua guida all&#039;alfabetizzazione statistica!\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/it\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"it-IT\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/it\/#\/schema\/person\/0896f191fb9fb019f2cd8623112cb3ae\",\"name\":\"Benjamin anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"it-IT\",\"@id\":\"https:\/\/statorials.org\/it\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/statorials.org\/it\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"https:\/\/statorials.org\/it\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"caption\":\"Benjamin anderson\"},\"description\":\"Ciao, sono Benjamin, un professore di statistica in pensione diventato insegnante dedicato di Statorials. Con una vasta esperienza e competenza nel campo della statistica, sono ansioso di condividere le mie conoscenze per potenziare gli studenti attraverso Statorials. Scopri di pi\u00f9\",\"sameAs\":[\"https:\/\/statorials.org\/it\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Regressione polinomiale in R (passo dopo passo) - Statorials","description":"Questo tutorial fornisce una semplice guida per comprendere e implementare la regressione polinomiale in R, incluso un esempio.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/it\/regressione-polinomiale-r\/","og_locale":"it_IT","og_type":"article","og_title":"Regressione polinomiale in R (passo dopo passo) - Statorials","og_description":"Questo tutorial fornisce una semplice guida per comprendere e implementare la regressione polinomiale in R, incluso un esempio.","og_url":"https:\/\/statorials.org\/it\/regressione-polinomiale-r\/","og_site_name":"Statorials","article_published_time":"2023-07-29T19:05:27+00:00","og_image":[{"url":"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/poly1-1.png"}],"author":"Benjamin anderson","twitter_card":"summary_large_image","twitter_misc":{"Written by":"Benjamin anderson","Est. reading time":"3 minuti"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/it\/regressione-polinomiale-r\/","url":"https:\/\/statorials.org\/it\/regressione-polinomiale-r\/","name":"Regressione polinomiale in R (passo dopo passo) - Statorials","isPartOf":{"@id":"https:\/\/statorials.org\/it\/#website"},"datePublished":"2023-07-29T19:05:27+00:00","dateModified":"2023-07-29T19:05:27+00:00","author":{"@id":"https:\/\/statorials.org\/it\/#\/schema\/person\/0896f191fb9fb019f2cd8623112cb3ae"},"description":"Questo tutorial fornisce una semplice guida per comprendere e implementare la regressione polinomiale in R, incluso un esempio.","breadcrumb":{"@id":"https:\/\/statorials.org\/it\/regressione-polinomiale-r\/#breadcrumb"},"inLanguage":"it-IT","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/it\/regressione-polinomiale-r\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/it\/regressione-polinomiale-r\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Casa","item":"https:\/\/statorials.org\/it\/"},{"@type":"ListItem","position":2,"name":"Regressione polinomiale in r (passo dopo passo)"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/it\/#website","url":"https:\/\/statorials.org\/it\/","name":"Statorials","description":"La tua guida all&#039;alfabetizzazione statistica!","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/it\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"it-IT"},{"@type":"Person","@id":"https:\/\/statorials.org\/it\/#\/schema\/person\/0896f191fb9fb019f2cd8623112cb3ae","name":"Benjamin anderson","image":{"@type":"ImageObject","inLanguage":"it-IT","@id":"https:\/\/statorials.org\/it\/#\/schema\/person\/image\/","url":"https:\/\/statorials.org\/it\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","contentUrl":"https:\/\/statorials.org\/it\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","caption":"Benjamin anderson"},"description":"Ciao, sono Benjamin, un professore di statistica in pensione diventato insegnante dedicato di Statorials. Con una vasta esperienza e competenza nel campo della statistica, sono ansioso di condividere le mie conoscenze per potenziare gli studenti attraverso Statorials. Scopri di pi\u00f9","sameAs":["https:\/\/statorials.org\/it"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/posts\/476"}],"collection":[{"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/comments?post=476"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/posts\/476\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/media?parent=476"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/categories?post=476"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/tags?post=476"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}