{"id":916,"date":"2023-07-28T08:02:55","date_gmt":"2023-07-28T08:02:55","guid":{"rendered":"https:\/\/statorials.org\/nl\/verwijder-uitschieters-r\/"},"modified":"2023-07-28T08:02:55","modified_gmt":"2023-07-28T08:02:55","slug":"verwijder-uitschieters-r","status":"publish","type":"post","link":"https:\/\/statorials.org\/nl\/verwijder-uitschieters-r\/","title":{"rendered":"Hoe uitschieters in r te verwijderen"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\">Een <strong>uitschieter<\/strong> is een waarneming die abnormaal ver verwijderd is van andere waarden in een dataset. Uitschieters kunnen problematisch zijn omdat ze de resultaten van een analyse kunnen be\u00efnvloeden.<\/span><\/p>\n<p> <span style=\"color: #000000;\">In deze tutorial wordt uitgelegd hoe u uitschieters in R kunt identificeren en verwijderen.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Hoe uitschieters in R te identificeren<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Voordat u uitbijters kunt verwijderen, moet u eerst beslissen wat u als een uitbijter beschouwt. Er zijn twee veel voorkomende manieren om dit te doen:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>1. Gebruik het interkwartielbereik.<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">De interkwartielafstand (IQR) is het verschil tussen het 75e percentiel (Q3) en het 25e percentiel (Q1) in een dataset. Het meet de verdeling van de gemiddelde 50% van de waarden.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Je kunt een waarneming als uitbijter defini\u00ebren als deze 1,5 maal de interkwartielafstand boven het derde kwartiel (Q3) of 1,5 maal de interkwartielafstand onder het eerste kwartiel (Q1) ligt.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Uitschieters = Waarnemingen &gt; Q3 + 1,5*IQR of &lt; Q1 \u2013 1,5*IQR<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>2. Gebruik z-scores.<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Een <a href=\"https:\/\/statorials.org\/nl\/zr-score\/\" target=\"_blank\" rel=\"noopener noreferrer\">z-score<\/a> vertelt u hoeveel standaarddeviaties een bepaalde waarde afwijkt van het gemiddelde. We gebruiken de volgende formule om een z-score te berekenen:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>z<\/strong> = (X \u2013 \u03bc) \/ \u03c3<\/span><\/p>\n<p> <span style=\"color: #000000;\">Goud:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">X is een enkele onbewerkte gegevenswaarde<\/span><\/li>\n<li> <span style=\"color: #000000;\">\u03bc is het populatiegemiddelde<\/span><\/li>\n<li> <span style=\"color: #000000;\">\u03c3 is de standaarddeviatie van de populatie<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">U kunt een waarneming als uitschieter defini\u00ebren als de z-score kleiner dan -3 of groter dan 3 is.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Uitschieters = Waarnemingen met z-scores &gt; 3 of &lt; -3<\/strong><\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Hoe uitschieters in R te verwijderen<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Zodra u hebt besloten wat u als een uitbijter beschouwt, kunt u deze identificeren en uit een dataset verwijderen. Om te illustreren hoe u dit kunt doen, gebruiken we het volgende dataframe:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#make this example reproducible<\/span> \nset.seed(0)\n\n<span style=\"color: #008080;\">#create data frame with three columns A', 'B', 'C'<\/span> \ndf &lt;- data.frame(A=rnorm(1000, mean=10, sd=3),\n                 B=rnorm(1000, mean=20, sd=3),\n                 C=rnorm(1000, mean=30, sd=3))\n\n<span style=\"color: #008080;\">#view first six rows of data frame<\/span>\nhead(df)\n         ABC\n1 13.78886 19.13945 31.33304\n2 9.02130 25.52332 30.03579\n3 13.98940 19.52971 29.97216\n4 13.81729 15.83059 29.09287\n5 11.24392 15.58069 31.47707\n6 5.38015 19.79144 28.19184\n<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">We kunnen vervolgens uitschieters defini\u00ebren en verwijderen met behulp van de z-score-methode of de interkwartielbereikmethode:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Z-score-methode:<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">De volgende code laat zien hoe u de z-score van elke waarde in elke kolom van het gegevensframe berekent en vervolgens de rijen verwijdert die ten minste \u00e9\u00e9n z-score hebben met een absolute waarde groter dan 3:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#find absolute value of z-score for each value in each column<\/span>\nz_scores &lt;- <span style=\"color: #3366ff;\">as.data.frame<\/span> (sapply(df, function(df) (abs(df-mean(df))\/sd(df))))\n\n<span style=\"color: #008080;\">#view first six rows of z_scores data frame\n<\/span>head(z_scores)\n\n          ABC\n1 1.2813403 0.25350805 0.39419878\n2 0.3110243 1.80496734 0.05890232\n3 1.3483190 0.12766847 0.08112630\n4 1.2908343 1.32044506 0.38824414\n5 0.4313316 1.40102642 0.44450451\n6 1.5271674 0.04327186 0.70295309\n\n<span style=\"color: #008080;\">#only keep rows in dataframe with all z-scores less than absolute value of 3<\/span> \nno_outliers &lt;- z_scores[!rowSums(z_scores&gt;3), ]\n\n<span style=\"color: #008080;\">#view row and column count of new data frame<\/span>\ndim(no_outliers)\n\n[1] 994 3\n<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Het oorspronkelijke dataframe had 1000 rijen en 3 kolommen. Het nieuwe dataframe heeft 994 rijen en 3 kolommen, wat ons vertelt dat 6 rijen zijn verwijderd omdat ze ten minste \u00e9\u00e9n z-score hadden met een absolute waarde groter dan 3 in een van hun kolommen.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Interkwartielbereikmethode:<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">In sommige gevallen willen we misschien alleen uitschieters in een kolom van een dataframe identificeren. Laten we bijvoorbeeld zeggen dat we alleen rijen met een uitbijter in kolom &#8218;A&#8216; van ons dataframe willen verwijderen.<\/span><\/p>\n<p> <span style=\"color: #000000;\">De volgende code laat zien hoe u rijen uit het dataframe verwijdert waarvan de waarde in kolom &#8218;A&#8216; 1,5 keer het interkwartielbereik boven het derde kwartiel (Q3) of 1,5 keer het interkwartielbereik onder het eerste kwartiel (Q1) is. .<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#find Q1, Q3, and interquartile range for values in column A<\/span>\nQ1 &lt;- quantile(df$A, .25)\nQ3 &lt;- quantile(df$A, .75)\nIQR &lt;- IQR(df$A)\n\n<span style=\"color: #008080;\">#only keep rows in dataframe that have values within 1.5*IQR of Q1 and Q3<\/span>\nno_outliers &lt;- subset(df, df$A&gt; (Q1 - 1.5*IQR) &amp; df$A&lt; (Q3 + 1.5*IQR))\n\n<span style=\"color: #008080;\">#view row and column count of new data frame\n<\/span>dim(no_outliers) \n\n[1] 994 3<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Het oorspronkelijke dataframe had 1000 rijen en 3 kolommen. Het nieuwe dataframe heeft 994 rijen en 3 kolommen, wat ons vertelt dat 6 rijen zijn verwijderd omdat ze ten minste \u00e9\u00e9n uitschieter in kolom A bevatten.<\/span><\/p>\n<h3> <strong>Wanneer uitschieters verwijderen?<\/strong><\/h3>\n<p> <span style=\"color: #000000;\">Als er \u00e9\u00e9n of meer uitschieters aanwezig zijn, moet u eerst verifi\u00ebren dat deze niet het gevolg zijn van een gegevensinvoerfout. Soms voert een individu eenvoudigweg de verkeerde gegevenswaarde in terwijl hij de gegevens opslaat.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Als de uitbijter het resultaat blijkt te zijn van een gegevensinvoerfout, kunt u besluiten om er een nieuwe waarde aan toe te kennen, zoals <a href=\"https:\/\/statorials.org\/nl\/meet-de-centrale-tendens\/\" target=\"_blank\" rel=\"noopener noreferrer\">het gemiddelde of de mediaan<\/a> van de dataset.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Als de waarde echt een uitschieter is, kunt u ervoor kiezen deze te verwijderen als deze een aanzienlijke impact heeft op uw algehele analyse. Zorg ervoor dat u in uw eindrapport of analyse vermeldt dat u een uitbijter hebt verwijderd.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Aanvullende bronnen<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">In deze tutorial hebben we <strong>rnorm()<\/strong> gebruikt om vectoren van normaal verdeelde willekeurige variabelen te genereren, gegeven een vectorlengte <em>n<\/em> , een populatiegemiddelde <em>\u03bc<\/em> en een populatiestandaarddeviatie <em>\u03c3<\/em> . Meer informatie over deze functie kunt u <a href=\"https:\/\/statorials.org\/nl\/dnorm-pnorm-rnorm-qnorm-in-r\/\" target=\"_blank\" rel=\"noopener noreferrer\">hier<\/a> vinden.<\/span><\/p>\n<p> <span style=\"color: #000000;\">We hebben ook <strong>sapply()<\/strong> gebruikt om een functie toe te passen op elke kolom in een dataframe dat z-scores berekende. Meer informatie over deze functie kunt u <a href=\"https:\/\/statorials.org\/nl\/een-gids-voor-het-aanbrengen-van-lapply-sapply-en-tapply-in-r\/\" target=\"_blank\" rel=\"noopener noreferrer\">hier<\/a> vinden.<\/span><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Een uitschieter is een waarneming die abnormaal ver verwijderd is van andere waarden in een dataset. Uitschieters kunnen problematisch zijn omdat ze de resultaten van een analyse kunnen be\u00efnvloeden. In deze tutorial wordt uitgelegd hoe u uitschieters in R kunt identificeren en verwijderen. Hoe uitschieters in R te identificeren Voordat u uitbijters kunt verwijderen, moet [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"class_list":["post-916","post","type-post","status-publish","format-standard","hentry","category-gids"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Hoe uitschieters te verwijderen in R - Statorials<\/title>\n<meta name=\"description\" content=\"Een eenvoudige uitleg over het verwijderen van uitschieters in R, inclusief verschillende voorbeelden.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/nl\/verwijder-uitschieters-r\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Hoe uitschieters te verwijderen in R - Statorials\" \/>\n<meta property=\"og:description\" content=\"Een eenvoudige uitleg over het verwijderen van uitschieters in R, inclusief verschillende voorbeelden.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/nl\/verwijder-uitschieters-r\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-28T08:02:55+00:00\" \/>\n<meta name=\"author\" content=\"Dr.benjamin anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"Dr.benjamin anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"4\u00a0Minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/nl\/verwijder-uitschieters-r\/\",\"url\":\"https:\/\/statorials.org\/nl\/verwijder-uitschieters-r\/\",\"name\":\"Hoe uitschieters te verwijderen in R - Statorials\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/nl\/#website\"},\"datePublished\":\"2023-07-28T08:02:55+00:00\",\"dateModified\":\"2023-07-28T08:02:55+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\"},\"description\":\"Een eenvoudige uitleg over het verwijderen van uitschieters in R, inclusief verschillende voorbeelden.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/nl\/verwijder-uitschieters-r\/#breadcrumb\"},\"inLanguage\":\"de\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/nl\/verwijder-uitschieters-r\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/nl\/verwijder-uitschieters-r\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Thuis\",\"item\":\"https:\/\/statorials.org\/nl\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Hoe uitschieters in r te verwijderen\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/nl\/#website\",\"url\":\"https:\/\/statorials.org\/nl\/\",\"name\":\"Statorials\",\"description\":\"Uw gids voor statistische competentie\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/nl\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"de\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\",\"name\":\"Dr.benjamin anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/\",\"url\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"caption\":\"Dr.benjamin anderson\"},\"description\":\"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder\",\"sameAs\":[\"http:\/\/statorials.org\/nl\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Hoe uitschieters te verwijderen in R - Statorials","description":"Een eenvoudige uitleg over het verwijderen van uitschieters in R, inclusief verschillende voorbeelden.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/nl\/verwijder-uitschieters-r\/","og_locale":"de_DE","og_type":"article","og_title":"Hoe uitschieters te verwijderen in R - Statorials","og_description":"Een eenvoudige uitleg over het verwijderen van uitschieters in R, inclusief verschillende voorbeelden.","og_url":"https:\/\/statorials.org\/nl\/verwijder-uitschieters-r\/","og_site_name":"Statorials","article_published_time":"2023-07-28T08:02:55+00:00","author":"Dr.benjamin anderson","twitter_card":"summary_large_image","twitter_misc":{"Verfasst von":"Dr.benjamin anderson","Gesch\u00e4tzte Lesezeit":"4\u00a0Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/nl\/verwijder-uitschieters-r\/","url":"https:\/\/statorials.org\/nl\/verwijder-uitschieters-r\/","name":"Hoe uitschieters te verwijderen in R - Statorials","isPartOf":{"@id":"https:\/\/statorials.org\/nl\/#website"},"datePublished":"2023-07-28T08:02:55+00:00","dateModified":"2023-07-28T08:02:55+00:00","author":{"@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219"},"description":"Een eenvoudige uitleg over het verwijderen van uitschieters in R, inclusief verschillende voorbeelden.","breadcrumb":{"@id":"https:\/\/statorials.org\/nl\/verwijder-uitschieters-r\/#breadcrumb"},"inLanguage":"de","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/nl\/verwijder-uitschieters-r\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/nl\/verwijder-uitschieters-r\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Thuis","item":"https:\/\/statorials.org\/nl\/"},{"@type":"ListItem","position":2,"name":"Hoe uitschieters in r te verwijderen"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/nl\/#website","url":"https:\/\/statorials.org\/nl\/","name":"Statorials","description":"Uw gids voor statistische competentie","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/nl\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"de"},{"@type":"Person","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219","name":"Dr.benjamin anderson","image":{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/","url":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","contentUrl":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","caption":"Dr.benjamin anderson"},"description":"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder","sameAs":["http:\/\/statorials.org\/nl"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/916","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/comments?post=916"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/916\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/media?parent=916"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/categories?post=916"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/tags?post=916"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}