{"id":478,"date":"2023-07-29T18:53:48","date_gmt":"2023-07-29T18:53:48","guid":{"rendered":"https:\/\/statorials.org\/nl\/jitter-functie-r\/"},"modified":"2023-07-29T18:53:48","modified_gmt":"2023-07-29T18:53:48","slug":"jitter-functie-r","status":"publish","type":"post","link":"https:\/\/statorials.org\/nl\/jitter-functie-r\/","title":{"rendered":"Hoe de jitter-functie in r te gebruiken voor puntenwolken"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\">In deze tutorial wordt uitgelegd wanneer en hoe u de <strong>jitter-<\/strong> functie in R voor puntenwolken kunt gebruiken.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Wanneer jitter gebruiken?<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\"><strong>Spreidingsdiagrammen<\/strong> zijn uitstekend geschikt voor het visualiseren van de relatie tussen twee continue variabelen. Het volgende spreidingsdiagram helpt ons bijvoorbeeld de relatie tussen lengte en gewicht voor 100 atleten te visualiseren:<\/span><\/p>\n<pre style=\"background-color: #e5e5e5; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#define vectors of heights and weights\n<\/span>weights &lt;- runif(100, 160, 240) \nheights &lt;- (weights\/3) + rnorm(100)\n\n<span style=\"color: #008080;\">#create data frame of heights and weights\n<\/span>data &lt;- as.data.frame(cbind(weights, heights))\n\n<span style=\"color: #008080;\">#view first six rows of data frame\n<\/span>head(data)\n\n# weights heights\n#1 170.8859 57.20745\n#2 183.2481 62.01162\n#3 235.6884 77.93126\n#4 231.9864 77.12520\n#5 200.8562 67.93486\n#6 169.6987 57.54977\n<span style=\"color: #008080;\">#create scatterplot of heights vs weights\n<\/span>plot(data$weights, data$heights, pch = 16, col = 'steelblue')<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Soms willen we echter misschien de relatie visualiseren tussen een continue variabele en een andere <em>bijna<\/em> continue variabele.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Stel dat we bijvoorbeeld de volgende gegevensset hebben die het aantal wedstrijden weergeeft dat een basketbalspeler is begonnen gedurende de eerste tien wedstrijden van een seizoen, samen met het gemiddelde aantal punten per wedstrijd:<\/span><\/p>\n<pre style=\"background-color: #e5e5e5; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#create data frame<\/span>\ngames_started &lt;- sample(1:10, 300, TRUE)\npoints_per_game &lt;- 3*games_started + rnorm(300)\ndata &lt;- as.data.frame(cbind(games_started, points_per_game))\n\n<span style=\"color: #008080;\">#view first six rows of data frame\n<\/span>head(data)\n\n# games_started points_per_game\n#1 9 25.831554\n#2 9 26.673983\n#3 10 29.850948\n#4 4 12.024353\n#5 4 11.534192\n#6 1 4.383127<\/strong><\/pre>\n<p> <span style=\"color: #000000;\"><em>Punten per spel<\/em> zijn een continue variabele, maar <em>gestarte spellen<\/em> zijn een discrete variabele. Als we proberen een spreidingsdiagram van deze twee variabelen te maken, ziet het er zo uit:<\/span><\/p>\n<pre style=\"background-color: #e5e5e5; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#create scatterplot of games started vs average points per game\n<\/span>plot(data$games_started, data$points_per_game, pch = 16, col = 'steelblue')<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Op basis van dit spreidingsdiagram kunnen we zeggen dat <em>het begin van het spel<\/em> en <em>het gemiddelde aantal punten per spel<\/em> een positieve relatie hebben, maar het is een beetje moeilijk om de individuele punten in het plot te zien, omdat veel ervan elkaar overlappen.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Met behulp van de <strong>Jitter-<\/strong> functie kunnen we wat &#8222;ruis&#8220; toevoegen aan de <em>gegenereerde variabelensets op de X-as,<\/em> zodat we de afzonderlijke punten op de grafiek duidelijker kunnen zien:<\/span><\/p>\n<pre style=\"background-color: #e5e5e5; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#add jitter to <em>games started\n<\/em><\/span>plot( <span style=\"color: #800080;\">jitter<\/span> (data$games_started), data$points_per_game, pch = 16, col = 'steelblue')<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">We kunnen optioneel een numeriek argument aan jitter toevoegen om nog meer ruis aan de gegevens toe te voegen:<\/span><\/p>\n<pre style=\"background-color: #e5e5e5; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#add jitter to <em>games started\n<\/em><\/span>plot( <span style=\"color: #800080;\">jitter<\/span> (data$games_started, <span style=\"color: #800080;\">2<\/span> ), data$points_per_game, pch = 16, col = 'steelblue')<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">We moeten echter oppassen dat we niet te veel jitter toevoegen, omdat dit de originele gegevens te veel zou kunnen vervormen:<\/span><\/p>\n<pre style=\"background-color: #e5e5e5; font-size: 15px;\"> <strong>plot( <span style=\"color: #800080;\">jitter<\/span> (data$games_started, <span style=\"color: #800080;\">20<\/span> ), data$points_per_game, pch = 16, col = 'steelblue')<\/strong><\/pre>\n<h3> <span style=\"color: #000000;\"><strong>Jittering zorgt voor een beter zicht op gegevens<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Instabiliteit is vooral handig wanneer een van de niveaus van de discrete variabele veel meer waarden heeft dan de andere niveaus.<\/span><\/p>\n<p> <span style=\"color: #000000;\">In de volgende dataset zijn er bijvoorbeeld driehonderd basketbalspelers die aan twee van de eerste vijf wedstrijden van het seizoen zijn begonnen, maar slechts ongeveer 100 spelers die aan 1, 3, 4 of 5 wedstrijden zijn begonnen:<br \/><\/span><\/p>\n<pre style=\"background-color: #e5e5e5; font-size: 15px;\"> <strong>games_started &lt;- sample(1:5, 100, TRUE)\npoints_per_game &lt;- 3*games_started + rnorm(100)\ndata &lt;- as.data.frame(cbind(games_started, points_per_game))\n\ngames_twos &lt;- rep(2, 200)\npoints_twos &lt;- 3*games_twos + rnorm(200)\ndata_twos &lt;- as.data.frame(cbind(games_twos, points_twos))\nnames(data_twos) &lt;- c('games_started', 'points_per_game')\n\nall_data &lt;- rbind(data, data_twos)<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Wanneer we het aantal gespeelde games visualiseren in verhouding tot de gemiddelde punten per game, kunnen we zeggen dat er meer spelers zijn die 2 games hebben gespeeld, maar het is moeilijk om precies te zeggen <em>hoeveel anderen<\/em> 2 games hebben gespeeld:<\/span><\/p>\n<pre style=\"background-color: #e5e5e5; font-size: 15px;\"> <strong>plot(all_data$games_started, all_data$points_per_game, pch = 16, col = 'steelblue')<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Zodra we echter jitter toevoegen aan de variabele voor het <em>begin van het spel<\/em> , kunnen we zien hoeveel extra spelers 2 games zijn gestart:<\/span><\/p>\n<pre style=\"background-color: #e5e5e5; font-size: 15px;\"> <strong>plot( <span style=\"color: #800080;\">jitter<\/span> (all_data$games_started), all_data$points_per_game,\n     pch=16, col='steelblue')<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Als u de hoeveelheid jitter iets verhoogt, wordt dit verschil nog duidelijker:<\/span><\/p>\n<pre style=\"background-color: #e5e5e5; font-size: 15px;\"> <strong>plot( <span style=\"color: #800080;\">jitter<\/span> (all_data$games_started, <span style=\"color: #800080;\">1.5<\/span> ), all_data$points_per_game,\n     pch=16, col='steelblue')<\/strong><\/pre>\n<h3>\n<p> <span style=\"color: #000000;\"><strong>Jitter alleen voor visualisaties<\/strong><\/span><\/p>\n<\/h3>\n<p> <span style=\"color: #000000;\">Zoals eerder vermeld, voegt jitter willekeurige ruis toe aan gegevens, wat nuttig kan zijn als we gegevens in een puntenwolk willen visualiseren. Door de jitterfunctie te gebruiken, kunnen we een beter beeld krijgen van de werkelijke onderliggende relatie tussen twee variabelen in een dataset.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Bij het gebruik van statistische analyses zoals regressie heeft het echter geen zin om willekeurige ruis toe te voegen aan de variabelen in een dataset, omdat dit de resultaten van een analyse zou be\u00efnvloeden.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Jitter is dus alleen bedoeld om te worden gebruikt voor datavisualisatie, niet voor data-analyse.<\/span><\/p>\n","protected":false},"excerpt":{"rendered":"<p>In deze tutorial wordt uitgelegd wanneer en hoe u de jitter- functie in R voor puntenwolken kunt gebruiken. Wanneer jitter gebruiken? Spreidingsdiagrammen zijn uitstekend geschikt voor het visualiseren van de relatie tussen twee continue variabelen. Het volgende spreidingsdiagram helpt ons bijvoorbeeld de relatie tussen lengte en gewicht voor 100 atleten te visualiseren: #define vectors of [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"class_list":["post-478","post","type-post","status-publish","format-standard","hentry","category-gids"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Hoe de Jitter-functie in R te gebruiken voor scatterplots - Statorials<\/title>\n<meta name=\"description\" content=\"In deze zelfstudie wordt uitgelegd hoe u de jitterfunctie in R gebruikt om spreidingsdiagrammen te maken die gemakkelijker en handiger te lezen zijn.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/nl\/jitter-functie-r\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Hoe de Jitter-functie in R te gebruiken voor scatterplots - Statorials\" \/>\n<meta property=\"og:description\" content=\"In deze zelfstudie wordt uitgelegd hoe u de jitterfunctie in R gebruikt om spreidingsdiagrammen te maken die gemakkelijker en handiger te lezen zijn.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/nl\/jitter-functie-r\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-29T18:53:48+00:00\" \/>\n<meta name=\"author\" content=\"Dr.benjamin anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"Dr.benjamin anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"4\u00a0Minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/nl\/jitter-functie-r\/\",\"url\":\"https:\/\/statorials.org\/nl\/jitter-functie-r\/\",\"name\":\"Hoe de Jitter-functie in R te gebruiken voor scatterplots - Statorials\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/nl\/#website\"},\"datePublished\":\"2023-07-29T18:53:48+00:00\",\"dateModified\":\"2023-07-29T18:53:48+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\"},\"description\":\"In deze zelfstudie wordt uitgelegd hoe u de jitterfunctie in R gebruikt om spreidingsdiagrammen te maken die gemakkelijker en handiger te lezen zijn.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/nl\/jitter-functie-r\/#breadcrumb\"},\"inLanguage\":\"de\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/nl\/jitter-functie-r\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/nl\/jitter-functie-r\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Thuis\",\"item\":\"https:\/\/statorials.org\/nl\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Hoe de jitter-functie in r te gebruiken voor puntenwolken\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/nl\/#website\",\"url\":\"https:\/\/statorials.org\/nl\/\",\"name\":\"Statorials\",\"description\":\"Uw gids voor statistische competentie\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/nl\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"de\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\",\"name\":\"Dr.benjamin anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/\",\"url\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"caption\":\"Dr.benjamin anderson\"},\"description\":\"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder\",\"sameAs\":[\"http:\/\/statorials.org\/nl\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Hoe de Jitter-functie in R te gebruiken voor scatterplots - Statorials","description":"In deze zelfstudie wordt uitgelegd hoe u de jitterfunctie in R gebruikt om spreidingsdiagrammen te maken die gemakkelijker en handiger te lezen zijn.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/nl\/jitter-functie-r\/","og_locale":"de_DE","og_type":"article","og_title":"Hoe de Jitter-functie in R te gebruiken voor scatterplots - Statorials","og_description":"In deze zelfstudie wordt uitgelegd hoe u de jitterfunctie in R gebruikt om spreidingsdiagrammen te maken die gemakkelijker en handiger te lezen zijn.","og_url":"https:\/\/statorials.org\/nl\/jitter-functie-r\/","og_site_name":"Statorials","article_published_time":"2023-07-29T18:53:48+00:00","author":"Dr.benjamin anderson","twitter_card":"summary_large_image","twitter_misc":{"Verfasst von":"Dr.benjamin anderson","Gesch\u00e4tzte Lesezeit":"4\u00a0Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/nl\/jitter-functie-r\/","url":"https:\/\/statorials.org\/nl\/jitter-functie-r\/","name":"Hoe de Jitter-functie in R te gebruiken voor scatterplots - Statorials","isPartOf":{"@id":"https:\/\/statorials.org\/nl\/#website"},"datePublished":"2023-07-29T18:53:48+00:00","dateModified":"2023-07-29T18:53:48+00:00","author":{"@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219"},"description":"In deze zelfstudie wordt uitgelegd hoe u de jitterfunctie in R gebruikt om spreidingsdiagrammen te maken die gemakkelijker en handiger te lezen zijn.","breadcrumb":{"@id":"https:\/\/statorials.org\/nl\/jitter-functie-r\/#breadcrumb"},"inLanguage":"de","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/nl\/jitter-functie-r\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/nl\/jitter-functie-r\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Thuis","item":"https:\/\/statorials.org\/nl\/"},{"@type":"ListItem","position":2,"name":"Hoe de jitter-functie in r te gebruiken voor puntenwolken"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/nl\/#website","url":"https:\/\/statorials.org\/nl\/","name":"Statorials","description":"Uw gids voor statistische competentie","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/nl\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"de"},{"@type":"Person","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219","name":"Dr.benjamin anderson","image":{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/","url":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","contentUrl":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","caption":"Dr.benjamin anderson"},"description":"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder","sameAs":["http:\/\/statorials.org\/nl"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/478","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/comments?post=478"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/478\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/media?parent=478"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/categories?post=478"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/tags?post=478"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}