{"id":1378,"date":"2023-07-26T15:27:32","date_gmt":"2023-07-26T15:27:32","guid":{"rendered":"https:\/\/statorials.org\/nl\/winnen\/"},"modified":"2023-07-26T15:27:32","modified_gmt":"2023-07-26T15:27:32","slug":"winnen","status":"publish","type":"post","link":"https:\/\/statorials.org\/nl\/winnen\/","title":{"rendered":"Gegevens winnen: definitie en voorbeelden"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\"><strong>Winsoriseren<\/strong> van gegevens houdt in dat extreme uitschieters gelijk worden gesteld aan een bepaald percentiel van de gegevens.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Een winsorisatie van 90% stelt bijvoorbeeld alle <a href=\"https:\/\/statorials.org\/nl\/observatie-in-de-statistiek\/\" target=\"_blank\" rel=\"noopener\">waarnemingen<\/a> boven het 95e percentiel gelijk aan de waarde op het 95e percentiel en alle waarnemingen onder het 5e percentiel gelijk aan de waarde op het 5e percentiel.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Het winsoriseren van data betekent namelijk het veranderen van de extreme waarden van een dataset naar minder extreme waarden.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Voorbeeld: gegevens winnen<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Stel dat we de volgende dataset hebben:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong>3, 14, 16, 16, 17, 29, 34, 36, 39, 47, 59, 64, 65, 66, 68, 79, 91, 98\n<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Om een winsorisatie van 90% op deze dataset uit te voeren, zouden we eerst het 5e percentiel en het 95e percentiel vinden, wat als volgt blijkt te zijn:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\"><strong>5e percentiel:<\/strong> 12,35<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>95e percentiel:<\/strong> 92,05<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">We zouden dan alle waarden kleiner dan 12,35 gelijk stellen aan 12,35 en alle waarden groter dan 92,05 gelijk aan 92,05:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong>12.35, 14, 16, 16, 17, 29, 34, 36, 39, 47, 59, 64, 65, 66, 68, 79, 91, 92.05<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">In dit geval werd de waarde <strong>3<\/strong> <strong>12,35<\/strong> en de waarde <strong>98<\/strong> werd <strong>92,05<\/strong> .<\/span><\/p>\n<h3> <strong><span style=\"color: #000000;\">Waarom Winsorize-gegevens?<\/span><\/strong><\/h3>\n<p> <span style=\"color: #000000;\">Gemiddelde en standaardafwijking zijn twee veelgebruikte methoden voor het meten van respectievelijk de <a href=\"https:\/\/statorials.org\/nl\/meet-de-centrale-tendens\/\" target=\"_blank\" rel=\"noopener\">locatie van het midden<\/a> van een dataset en de verdeling van waarnemingen in een dataset.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Deze twee maatstaven kunnen echter beide worden be\u00efnvloed door extreme uitschieters. Door de gegevens te winnen kunnen we dus extreme uitschieters defini\u00ebren die gelijk zijn aan minder extreme waarden.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Hierdoor kunnen we vaak een nauwkeuriger beeld krijgen van het gemiddelde en de standaardafwijking van de dataset.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Pruim goud winsorize<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Een andere veel voorkomende manier om met uitbijters om te gaan, is door ze uit de dataset <strong>te verwijderen<\/strong> , wat betekent dat ze volledig worden verwijderd.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Neem bijvoorbeeld de vorige dataset:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong>3, 14, 16, 16, 17, 29, 34, 36, 39, 47, 59, 64, 65, 66, 68, 79, 91, 98<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Als we waarden onder het 5e percentiel of boven het 95e percentiel zouden willen verlagen, zouden we eenvoudigweg de waarden <strong>3<\/strong> en <strong>98<\/strong> verwijderen.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Hier volgen enkele vuistregels voor het gebruik van slicen of winsorisatie:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Trimmen:<\/strong> Het is zinvol om gegevenswaarden bij te snijden wanneer sommige waarden volkomen onredelijk lijken, dat wil zeggen dat ze het resultaat zijn van een gegevensinvoerfout.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Winsorisatie:<\/strong> Het is zinvol om gegevens te winnen als we waarnemingen willen behouden die zich in de extremen bevinden, maar ze niet te letterlijk willen nemen.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Voorzorgsmaatregelen met betrekking tot het winnen van gegevens<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Hier volgen enkele zaken waarmee u rekening moet houden als u besluit gegevens te verzamelen:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>1.<\/strong> Als er geen extreme uitschieters zijn, zal het winsoriseren van de gegevens de kleinste en grootste waarden slechts lichtjes veranderen. Dit is over het algemeen geen goed idee, omdat het betekent dat we simpelweg gegevenswaarden veranderen met als enig doel ze te veranderen.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>2.<\/strong> Uitschieters kunnen interessante randgevallen in de gegevens vertegenwoordigen. Voordat u de uitschieters bewerkt, is het dus een goed idee om ze nader te bekijken om te zien wat de oorzaak ervan zou kunnen zijn.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>3.<\/strong> U moet beslissen of u de gegevens wel of niet wilt winnen <em>na<\/em> het verzamelen van de gegevens, en niet eerder. Voordat u besluit om te winnen, moet u eerst kijken of er daadwerkelijk sprake is van extreme uitschieters. Als er geen extreme uitschieters aanwezig zijn, kan winsorisatie onnodig zijn.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Tutorial: Gegevens winsoriseren in Excel<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Raadpleeg <a href=\"https:\/\/statorials.org\/nl\/excel-gegevens-winsoriseren\/\" target=\"_blank\" rel=\"noopener\">deze tutorial<\/a> voor een stapsgewijs voorbeeld van hoe u een gegevensset in Excel kunt winnen.<\/span><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Winsoriseren van gegevens houdt in dat extreme uitschieters gelijk worden gesteld aan een bepaald percentiel van de gegevens. Een winsorisatie van 90% stelt bijvoorbeeld alle waarnemingen boven het 95e percentiel gelijk aan de waarde op het 95e percentiel en alle waarnemingen onder het 5e percentiel gelijk aan de waarde op het 5e percentiel. Het winsoriseren [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"class_list":["post-1378","post","type-post","status-publish","format-standard","hentry","category-gids"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Hoe gegevens te winnen: definitie en voorbeelden - Statorials<\/title>\n<meta name=\"description\" content=\"In deze tutorial wordt uitgelegd hoe en waarom gegevens worden gewinsoriseerd, met verschillende voorbeelden.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/nl\/winnen\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Hoe gegevens te winnen: definitie en voorbeelden - Statorials\" \/>\n<meta property=\"og:description\" content=\"In deze tutorial wordt uitgelegd hoe en waarom gegevens worden gewinsoriseerd, met verschillende voorbeelden.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/nl\/winnen\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-26T15:27:32+00:00\" \/>\n<meta name=\"author\" content=\"Dr.benjamin anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"Dr.benjamin anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"3\u00a0Minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/nl\/winnen\/\",\"url\":\"https:\/\/statorials.org\/nl\/winnen\/\",\"name\":\"Hoe gegevens te winnen: definitie en voorbeelden - Statorials\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/nl\/#website\"},\"datePublished\":\"2023-07-26T15:27:32+00:00\",\"dateModified\":\"2023-07-26T15:27:32+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\"},\"description\":\"In deze tutorial wordt uitgelegd hoe en waarom gegevens worden gewinsoriseerd, met verschillende voorbeelden.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/nl\/winnen\/#breadcrumb\"},\"inLanguage\":\"de\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/nl\/winnen\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/nl\/winnen\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Thuis\",\"item\":\"https:\/\/statorials.org\/nl\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Gegevens winnen: definitie en voorbeelden\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/nl\/#website\",\"url\":\"https:\/\/statorials.org\/nl\/\",\"name\":\"Statorials\",\"description\":\"Uw gids voor statistische competentie\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/nl\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"de\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\",\"name\":\"Dr.benjamin anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/\",\"url\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"caption\":\"Dr.benjamin anderson\"},\"description\":\"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder\",\"sameAs\":[\"http:\/\/statorials.org\/nl\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Hoe gegevens te winnen: definitie en voorbeelden - Statorials","description":"In deze tutorial wordt uitgelegd hoe en waarom gegevens worden gewinsoriseerd, met verschillende voorbeelden.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/nl\/winnen\/","og_locale":"de_DE","og_type":"article","og_title":"Hoe gegevens te winnen: definitie en voorbeelden - Statorials","og_description":"In deze tutorial wordt uitgelegd hoe en waarom gegevens worden gewinsoriseerd, met verschillende voorbeelden.","og_url":"https:\/\/statorials.org\/nl\/winnen\/","og_site_name":"Statorials","article_published_time":"2023-07-26T15:27:32+00:00","author":"Dr.benjamin anderson","twitter_card":"summary_large_image","twitter_misc":{"Verfasst von":"Dr.benjamin anderson","Gesch\u00e4tzte Lesezeit":"3\u00a0Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/nl\/winnen\/","url":"https:\/\/statorials.org\/nl\/winnen\/","name":"Hoe gegevens te winnen: definitie en voorbeelden - Statorials","isPartOf":{"@id":"https:\/\/statorials.org\/nl\/#website"},"datePublished":"2023-07-26T15:27:32+00:00","dateModified":"2023-07-26T15:27:32+00:00","author":{"@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219"},"description":"In deze tutorial wordt uitgelegd hoe en waarom gegevens worden gewinsoriseerd, met verschillende voorbeelden.","breadcrumb":{"@id":"https:\/\/statorials.org\/nl\/winnen\/#breadcrumb"},"inLanguage":"de","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/nl\/winnen\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/nl\/winnen\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Thuis","item":"https:\/\/statorials.org\/nl\/"},{"@type":"ListItem","position":2,"name":"Gegevens winnen: definitie en voorbeelden"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/nl\/#website","url":"https:\/\/statorials.org\/nl\/","name":"Statorials","description":"Uw gids voor statistische competentie","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/nl\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"de"},{"@type":"Person","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219","name":"Dr.benjamin anderson","image":{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/","url":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","contentUrl":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","caption":"Dr.benjamin anderson"},"description":"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder","sameAs":["http:\/\/statorials.org\/nl"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/1378","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/comments?post=1378"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/1378\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/media?parent=1378"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/categories?post=1378"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/tags?post=1378"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}