{"id":476,"date":"2023-07-29T19:05:27","date_gmt":"2023-07-29T19:05:27","guid":{"rendered":"https:\/\/statorials.org\/nl\/polynomiale-regressie-r\/"},"modified":"2023-07-29T19:05:27","modified_gmt":"2023-07-29T19:05:27","slug":"polynomiale-regressie-r","status":"publish","type":"post","link":"https:\/\/statorials.org\/nl\/polynomiale-regressie-r\/","title":{"rendered":"Polynomiale regressie in r (stap voor stap)"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\"><a href=\"https:\/\/statorials.org\/nl\/polynomiale-regressie-1\/\" target=\"_blank\" rel=\"noopener noreferrer\">Polynomiale regressie<\/a> is een techniek die we kunnen gebruiken wanneer de relatie tussen een voorspellende variabele en een <a href=\"https:\/\/statorials.org\/nl\/variabelen-verklarende-reacties\/\" target=\"_blank\" rel=\"noopener noreferrer\">responsvariabele<\/a> niet-lineair is.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Dit type regressie heeft de vorm:<\/span><\/p>\n<p> <span style=\"color: #000000;\">Y = \u03b2 <sub>0<\/sub> <sup>+<\/sup> \u03b2 <sub>1<\/sub> X + \u03b2 <sub>2<\/sub> X <sup>2<\/sup> + \u2026 + \u03b2 <sub>h<\/sub><\/span><\/p>\n<p> <span style=\"color: #000000;\">waarbij <em>h<\/em> de \u201cgraad\u201d van de polynoom is.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Deze tutorial biedt een stapsgewijs voorbeeld van hoe u polynomiale regressie in R kunt uitvoeren.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Stap 1: Cre\u00eber de gegevens<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Voor dit voorbeeld maken we een dataset aan met daarin het aantal gestudeerde uren en het eindexamencijfer voor een klas van 50 studenten:<\/span><\/p>\n<pre style=\"background-color: #e5e5e5; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#make this example reproducible<\/span>\nset.seed(1)\n\n<span style=\"color: #008080;\">#create dataset\n<\/span>df &lt;- data.frame(hours = <span style=\"color: #3366ff;\">runif<\/span> (50, 5, 15), score=50)\ndf$score = df$score + df$hours^3\/150 + df$hours* <span style=\"color: #3366ff;\">runif<\/span> (50, 1, 2)\n\n<span style=\"color: #008080;\">#view first six rows of data\n<\/span>head(data)\n\n      hours score\n1 7.655087 64.30191\n2 8.721239 70.65430\n3 10.728534 73.66114\n4 14.082078 86.14630\n5 7.016819 59.81595\n6 13.983897 83.60510\n<\/strong><\/pre>\n<h3> <span style=\"color: #000000;\"><strong>Stap 2: Visualiseer de gegevens<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Voordat we een regressiemodel op de gegevens toepassen, maken we eerst een spreidingsdiagram om de relatie tussen het aantal bestudeerde uren en de examenscore te visualiseren:<\/span> <\/p>\n<pre style=\"background-color: #e5e5e5; font-size: 15px;\"> <strong><span style=\"color: #993300;\">library<\/span> (ggplot2)\n\nggplot(df, <span style=\"color: #3366ff;\">aes<\/span> (x=hours, y=score)) +\n  geom_point()<\/strong> <\/pre>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-12001 \" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/poly1-1.png\" alt=\"\" width=\"457\" height=\"450\" srcset=\"\" sizes=\"auto, \"><\/p>\n<p> <span style=\"color: #000000;\">We kunnen zien dat de gegevens een enigszins kwadratisch verband hebben, wat aangeeft dat polynomiale regressie wellicht beter bij de gegevens past dan eenvoudige lineaire regressie.<\/span><\/p>\n<h3> <strong><span style=\"color: #000000;\">Stap 3: Pas polynomiale regressiemodellen aan<\/span><\/strong><\/h3>\n<p> <span style=\"color: #000000;\">Vervolgens passen we vijf verschillende polynomiale regressiemodellen aan met graden <em>h<\/em> = 1\u20265 en gebruiken we k-voudige kruisvalidatie met k = 10 keer om de MSE-test voor elk model te berekenen:<\/span><\/p>\n<pre style=\"background-color: #e5e5e5; font-size: 15px;\"> <span style=\"color: #000000;\"><strong><span style=\"color: #008080;\">#randomly shuffle data\n<\/span>df.shuffled &lt;- df[ <span style=\"color: #3366ff;\">sample<\/span> ( <span style=\"color: #3366ff;\">nrow<\/span> (df)),]\n\n<span style=\"color: #008080;\">#define number of folds to use for k-fold cross-validation\n<\/span>K &lt;- 10 \n\n<span style=\"color: #008080;\">#define degree of polynomials to fit\n<\/span>degree &lt;- 5\n\n<span style=\"color: #008080;\">#create k equal-sized folds\n<\/span>folds &lt;- cut( <span style=\"color: #3366ff;\">seq<\/span> (1, <span style=\"color: #3366ff;\">nrow<\/span> (df.shuffled)), breaks=K, labels= <span style=\"color: #008000;\">FALSE<\/span> )\n\n<span style=\"color: #008080;\">#create object to hold MSE's of models\n<\/span>mse = matrix(data=NA,nrow=K,ncol=degree)\n\n<span style=\"color: #008080;\">#Perform K-fold cross validation\n<\/span><span style=\"color: #008000;\">for<\/span> (i <span style=\"color: #008000;\">in<\/span> 1:K){\n    \n<span style=\"color: #008080;\">#define training and testing data\n<\/span>testIndexes &lt;- <span style=\"color: #3366ff;\">which<\/span> (folds==i,arr.ind= <span style=\"color: #008000;\">TRUE<\/span> )\n    testData &lt;- df.shuffled[testIndexes, ]\n    trainData &lt;- df.shuffled[-testIndexes, ]\n    \n<span style=\"color: #008080;\">#use k-fold cv to evaluate models\n<\/span>for (j in 1:degree){\n        fit.train = <span style=\"color: #3366ff;\">lm<\/span> (score ~ <span style=\"color: #3366ff;\">poly<\/span> (hours,d), data=trainData)\n        fit.test = <span style=\"color: #3366ff;\">predict<\/span> (fit.train, newdata=testData)\n        mse[i,j] = <span style=\"color: #3366ff;\">mean<\/span> ((fit.test-testData$score)^2) \n    }\n}\n\n<span style=\"color: #008080;\">#find MSE for each degree \n<\/span>colMeans(mse)\n\n[1] 9.802397 8.748666 9.601865 10.592569 13.545547\n<\/strong><\/span><\/pre>\n<p> <span style=\"color: #000000;\">Uit het resultaat kunnen we de MSE-test voor elk model zien:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">MSE-toets met graad h = 1: <strong>9,80<\/strong><\/span><\/li>\n<li> <span style=\"color: #000000;\">MSE-toets met graad h = 2: <strong>8,75<\/strong><\/span><\/li>\n<li> <span style=\"color: #000000;\">MSE-toets met graad h = 3: <strong>9,60<\/strong><\/span><\/li>\n<li> <span style=\"color: #000000;\">MSE-toets met graad h = 4: <strong>10,59<\/strong><\/span><\/li>\n<li> <span style=\"color: #000000;\">MSE-toets met graad h = 5: <strong>13,55<\/strong><\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Het model met de laagste test-MSE bleek het polynomiale regressiemodel met graad <em>h<\/em> = 2 te zijn.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Dit komt overeen met onze intu\u00eftie uit het oorspronkelijke spreidingsdiagram: een kwadratisch regressiemodel past het beste bij de gegevens.<\/span><\/p>\n<h3> <strong><span style=\"color: #000000;\">Stap 4: Analyseer het definitieve model<\/span><\/strong><\/h3>\n<p> <span style=\"color: #000000;\">Ten slotte kunnen we de co\u00ebffici\u00ebnten van het best presterende model verkrijgen:<\/span><\/p>\n<pre style=\"background-color: #e5e5e5; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#fit best model<\/span>\nbest = <span style=\"color: #3366ff;\">lm<\/span> (score ~ <span style=\"color: #3366ff;\">poly<\/span> (hours,2, raw= <span style=\"color: #008000;\">T<\/span> ), data=df)\n\n<span style=\"color: #008080;\">#view summary of best model<\/span>\nsummary(best)\n\nCall:\nlm(formula = score ~ poly(hours, 2, raw = T), data = df)\n\nResiduals:\n    Min 1Q Median 3Q Max \n-5.6589 -2.0770 -0.4599 2.5923 4.5122 \n\nCoefficients:\n                         Estimate Std. Error t value Pr(&gt;|t|)    \n(Intercept) 54.00526 5.52855 9.768 6.78e-13 ***\npoly(hours, 2, raw = T)1 -0.07904 1.15413 -0.068 0.94569    \npoly(hours, 2, raw = T)2 0.18596 0.05724 3.249 0.00214 ** \n---\nSignificant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Uit het resultaat kunnen we zien dat het uiteindelijk gemonteerde model:<\/span><\/p>\n<p> <span style=\"color: #000000;\">Score = 54,00526 \u2013 0,07904*(uren) + 0,18596*(uren) <sup>2<\/sup><\/span><\/p>\n<p> <span style=\"color: #000000;\">Met deze vergelijking kunnen we een schatting maken van de score die een student krijgt op basis van het aantal gestudeerde uren.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Een student die bijvoorbeeld 10 uur studeert, zou een cijfer van <strong>71,81<\/strong> moeten krijgen:<\/span><\/p>\n<p> <span style=\"color: #000000;\">Score = 54,00526 \u2013 0,07904*(10) + 0,18596*(10) <sup>2<\/sup> = 71,81<\/span><\/p>\n<p> <span style=\"color: #000000;\">We kunnen ook het aangepaste model plotten om te zien hoe goed het past bij de onbewerkte gegevens:<\/span> <\/p>\n<pre style=\"background-color: #e5e5e5; font-size: 15px;\"> <strong>ggplot(df, <span style=\"color: #3366ff;\">aes<\/span> (x=hours, y=score)) + \n          geom_point() +\n          stat_smooth(method=' <span style=\"color: #008000;\">lm<\/span> ', formula = y ~ <span style=\"color: #3366ff;\">poly<\/span> (x,2), size = 1) + \n          xlab(' <span style=\"color: #008000;\">Hours Studied<\/span> ') +\n          ylab(' <span style=\"color: #008000;\">Score<\/span> ')<\/strong> <\/pre>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-12002 \" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/poly2.png\" alt=\"Polynomiale regressie in R\" width=\"446\" height=\"449\" srcset=\"\" sizes=\"auto, \"><\/p>\n<p> <span style=\"color: #000000;\">De volledige R-code die in dit voorbeeld wordt gebruikt, vindt u <a href=\"https:\/\/github.com\/Statorials\/R-Guides\/blob\/main\/polynomial_regression.R\" target=\"_blank\" rel=\"noopener noreferrer\">hier<\/a> .<\/span><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Polynomiale regressie is een techniek die we kunnen gebruiken wanneer de relatie tussen een voorspellende variabele en een responsvariabele niet-lineair is. Dit type regressie heeft de vorm: Y = \u03b2 0 + \u03b2 1 X + \u03b2 2 X 2 + \u2026 + \u03b2 h waarbij h de \u201cgraad\u201d van de polynoom is. Deze tutorial [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"class_list":["post-476","post","type-post","status-publish","format-standard","hentry","category-gids"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Polynomiale regressie in R (stap voor stap) - Statorials<\/title>\n<meta name=\"description\" content=\"Deze tutorial biedt een eenvoudige handleiding voor het begrijpen en implementeren van polynomiale regressie in R, inclusief een voorbeeld.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/nl\/polynomiale-regressie-r\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Polynomiale regressie in R (stap voor stap) - Statorials\" \/>\n<meta property=\"og:description\" content=\"Deze tutorial biedt een eenvoudige handleiding voor het begrijpen en implementeren van polynomiale regressie in R, inclusief een voorbeeld.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/nl\/polynomiale-regressie-r\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-29T19:05:27+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/poly1-1.png\" \/>\n<meta name=\"author\" content=\"Dr.benjamin anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"Dr.benjamin anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"3\u00a0Minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/nl\/polynomiale-regressie-r\/\",\"url\":\"https:\/\/statorials.org\/nl\/polynomiale-regressie-r\/\",\"name\":\"Polynomiale regressie in R (stap voor stap) - Statorials\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/nl\/#website\"},\"datePublished\":\"2023-07-29T19:05:27+00:00\",\"dateModified\":\"2023-07-29T19:05:27+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\"},\"description\":\"Deze tutorial biedt een eenvoudige handleiding voor het begrijpen en implementeren van polynomiale regressie in R, inclusief een voorbeeld.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/nl\/polynomiale-regressie-r\/#breadcrumb\"},\"inLanguage\":\"de\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/nl\/polynomiale-regressie-r\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/nl\/polynomiale-regressie-r\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Thuis\",\"item\":\"https:\/\/statorials.org\/nl\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Polynomiale regressie in r (stap voor stap)\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/nl\/#website\",\"url\":\"https:\/\/statorials.org\/nl\/\",\"name\":\"Statorials\",\"description\":\"Uw gids voor statistische competentie\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/nl\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"de\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\",\"name\":\"Dr.benjamin anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/\",\"url\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"caption\":\"Dr.benjamin anderson\"},\"description\":\"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder\",\"sameAs\":[\"http:\/\/statorials.org\/nl\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Polynomiale regressie in R (stap voor stap) - Statorials","description":"Deze tutorial biedt een eenvoudige handleiding voor het begrijpen en implementeren van polynomiale regressie in R, inclusief een voorbeeld.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/nl\/polynomiale-regressie-r\/","og_locale":"de_DE","og_type":"article","og_title":"Polynomiale regressie in R (stap voor stap) - Statorials","og_description":"Deze tutorial biedt een eenvoudige handleiding voor het begrijpen en implementeren van polynomiale regressie in R, inclusief een voorbeeld.","og_url":"https:\/\/statorials.org\/nl\/polynomiale-regressie-r\/","og_site_name":"Statorials","article_published_time":"2023-07-29T19:05:27+00:00","og_image":[{"url":"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/poly1-1.png"}],"author":"Dr.benjamin anderson","twitter_card":"summary_large_image","twitter_misc":{"Verfasst von":"Dr.benjamin anderson","Gesch\u00e4tzte Lesezeit":"3\u00a0Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/nl\/polynomiale-regressie-r\/","url":"https:\/\/statorials.org\/nl\/polynomiale-regressie-r\/","name":"Polynomiale regressie in R (stap voor stap) - Statorials","isPartOf":{"@id":"https:\/\/statorials.org\/nl\/#website"},"datePublished":"2023-07-29T19:05:27+00:00","dateModified":"2023-07-29T19:05:27+00:00","author":{"@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219"},"description":"Deze tutorial biedt een eenvoudige handleiding voor het begrijpen en implementeren van polynomiale regressie in R, inclusief een voorbeeld.","breadcrumb":{"@id":"https:\/\/statorials.org\/nl\/polynomiale-regressie-r\/#breadcrumb"},"inLanguage":"de","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/nl\/polynomiale-regressie-r\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/nl\/polynomiale-regressie-r\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Thuis","item":"https:\/\/statorials.org\/nl\/"},{"@type":"ListItem","position":2,"name":"Polynomiale regressie in r (stap voor stap)"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/nl\/#website","url":"https:\/\/statorials.org\/nl\/","name":"Statorials","description":"Uw gids voor statistische competentie","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/nl\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"de"},{"@type":"Person","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219","name":"Dr.benjamin anderson","image":{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/","url":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","contentUrl":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","caption":"Dr.benjamin anderson"},"description":"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder","sameAs":["http:\/\/statorials.org\/nl"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/476","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/comments?post=476"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/476\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/media?parent=476"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/categories?post=476"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/tags?post=476"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}