{"id":4619,"date":"2023-07-09T14:26:52","date_gmt":"2023-07-09T14:26:52","guid":{"rendered":"https:\/\/statorials.org\/nl\/vage-correspondentie-in-de-luchtsluis\/"},"modified":"2023-07-09T14:26:52","modified_gmt":"2023-07-09T14:26:52","slug":"vage-correspondentie-in-de-luchtsluis","status":"publish","type":"post","link":"https:\/\/statorials.org\/nl\/vage-correspondentie-in-de-luchtsluis\/","title":{"rendered":"Fuzzy matching uitvoeren in sas (met voorbeeld)"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\">Vaak wilt u mogelijk twee sets gegevens samenvoegen in SAS op basis van niet perfect overeenkomende tekenreeksen.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Dit wordt vaak <strong>fuzzy matching<\/strong> genoemd.<\/span><\/p>\n<p> <span style=\"color: #000000;\">De eenvoudigste manier om fuzzy matching uit te voeren in SAS is door de <a href=\"https:\/\/documentation.sas.com\/doc\/en\/pgmsascdc\/v_038\/lefunctionsref\/n1i9a3o4kciemhn1kpgutl20e4i0.htm\" target=\"_blank\" rel=\"noopener\">SOUNDEX-<\/a> functie te gebruiken met de <a href=\"https:\/\/documentation.sas.com\/doc\/en\/pgmsascdc\/v_038\/lefunctionsref\/p1r4l9jwgatggtn1ko81fyjys4s7.htm\" target=\"_blank\" rel=\"noopener\">COMPGED-<\/a> functie.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Deze twee functies worden gebruikt om de gelijkenis tussen strings te kwantificeren en kunnen worden gebruikt om vergelijkbare strings te &#8222;matchen&#8220;.<\/span><\/p>\n<p> <span style=\"color: #000000;\">In het volgende voor beeld ziet u hoe u deze functies kunt gebruiken om fuzzy matching uit te voeren in SAS.<\/span><\/p>\n<h2> <span style=\"color: #000000;\"><strong>Voorbeeld: hoe u fuzzy matching uitvoert in SAS<\/strong><\/span><\/h2>\n<p> <span style=\"color: #000000;\">Stel dat we de volgende dataset in SAS hebben die informatie bevat over de teamnamen en punten van verschillende basketbalspelers:<\/span> <\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <span style=\"color: #000000;\"><strong><span style=\"color: #008000;\">\/*create first dataset*\/     \n<\/span><span style=\"color: #800080;\">data<\/span> data1;\n  <span style=\"color: #3366ff;\">input<\/span> team $points;\n  <span style=\"color: #3366ff;\">datalines<\/span> ;\nMavs 19\nNets 22\nKings 34\nWarriors 19\nMagic 32   \n;\n<span style=\"color: #800080;\">run<\/span> ;\n<span style=\"color: #008000;\">\/*view dataset*\/\n<\/span><span style=\"color: #800080;\">proc print<\/span> <span style=\"color: #3366ff;\">data<\/span> =data1;<\/strong><\/span> <\/pre>\n<p><img decoding=\"async\" loading=\"lazy\" class=\" wp-image-36024 aligncenter\" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/fuzz1.png\" alt=\"\" width=\"184\" height=\"167\" srcset=\"\" sizes=\"auto, \"><\/p>\n<p> <span style=\"color: #000000;\">En stel dat we nog een dataset hebben met de teamnamen en assists van verschillende basketbalspelers:<\/span> <\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <span style=\"color: #000000;\"><strong><span style=\"color: #008000;\">\/*create second dataset*\/     \n<\/span><span style=\"color: #800080;\">data<\/span> data2;\n  <span style=\"color: #3366ff;\">input<\/span> team $assists;\n  <span style=\"color: #3366ff;\">datalines<\/span> ;\nNetts 8\nMajick 7\nKeengs 8\nWarriors 12\nMavs 4    \n;\n<span style=\"color: #800080;\">run<\/span> ;\n<span style=\"color: #008000;\">\/*view dataset*\/\n<\/span><span style=\"color: #800080;\">proc print<\/span> <span style=\"color: #3366ff;\">data<\/span> =data2;<\/strong><\/span> <\/pre>\n<p><img decoding=\"async\" loading=\"lazy\" class=\" wp-image-36025 aligncenter\" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/fuzz2.png\" alt=\"\" width=\"192\" height=\"170\" srcset=\"\" sizes=\"auto, \"><\/p>\n<p> <span style=\"color: #000000;\">Merk op dat veel teamnamen in deze dataset vergelijkbaar zijn, maar niet precies hetzelfde als de teamnamen in de vorige dataset.<\/span><\/p>\n<p> <span style=\"color: #000000;\">We kunnen de volgende syntaxis in SAS gebruiken om een fuzzy match uit te voeren en deze twee datasets samen te brengen op basis van vergelijkbare teamnamen:<\/span> <\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <span style=\"color: #008000; font-size: 15px; font-weight: bold;\">\/*use fuzzy matching to merge datasets based on similar team names*\/\n<\/span><span style=\"color: #800080; font-size: 15px; font-weight: bold;\">data<\/span> <b style=\"color: #000000; font-size: 15px;\">data3;                                       \n  <\/b><span style=\"color: #3366ff; font-size: 15px; font-weight: bold;\">setdata1<\/span> <b style=\"color: #000000; font-size: 15px;\">;\n  tmp1=<\/b> <span style=\"color: #3366ff; font-size: 15px; font-weight: bold;\">soundex<\/span> <b style=\"color: #000000; font-size: 15px;\">(team); <span style=\"color: #008000;\">\/*encode team names from data1<\/span> <span style=\"color: #008000;\">*\/<\/span>\n  <\/b><span style=\"color: #3366ff; font-size: 15px; font-weight: bold;\">do<\/span> <b style=\"color: #000000; font-size: 15px;\">i=1<\/b> <span style=\"color: #3366ff; font-size: 15px; font-weight: bold;\">to<\/span> <b style=\"color: #000000; font-size: 15px;\">nobs;     \n    <\/b><span style=\"color: #3366ff; font-size: 15px; font-weight: bold;\">set<\/span> <b style=\"color: #000000; font-size: 15px;\">data2( <span style=\"color: #3366ff;\">rename<\/span> =(team=team2)) <span style=\"color: #3366ff;\">point<\/span> =i <span style=\"color: #3366ff;\">nobs<\/span> =nobs;        \n    tmp2=<\/b> <span style=\"color: #3366ff; font-size: 15px; font-weight: bold;\">soundex<\/span> <b style=\"color: #000000; font-size: 15px;\">(team2); <span style=\"color: #008000;\">\/*encode team names from data2*<\/span> <span style=\"color: #008000;\">\/<\/span>\n    dif= <span style=\"color: #3366ff;\">compged<\/span> (tmp1,tmp2); <span style=\"color: #008000;\">\/*determine similarity between team names<\/span> <span style=\"color: #008000;\">*\/<\/span>\n    <span style=\"color: #3366ff;\">if<\/span> dif&lt;=50 <span style=\"color: #3366ff;\">then<\/span> <span style=\"color: #3366ff;\">do<\/span> ;\n      <\/b><span style=\"color: #3366ff; font-size: 15px; font-weight: bold;\">drop<\/span> <b style=\"color: #000000; font-size: 15px;\">i tmp1 tmp2 dif; <span style=\"color: #008000;\">\/*dr<\/span><\/b> <b style=\"color: #000000; font-size: 15px;\"><span style=\"color: #008000;\">op unnecessary variables*\/<\/span>\n      <span style=\"color: #3366ff;\">output<\/span> ;\n    <span style=\"color: #3366ff;\">end<\/span> ;\n  <span style=\"color: #3366ff;\">end<\/span> ;\n<\/b><span style=\"color: #800080; font-size: 15px; font-weight: bold;\">run<\/span> <b style=\"color: #000000; font-size: 15px;\">;\n\n<\/b><span style=\"color: #008000; font-size: 15px; font-weight: bold;\">\/*view resulting dataset*\/\n<\/span><span style=\"color: #800080; font-size: 15px; font-weight: bold;\">proc print<\/span> <b style=\"color: #000000; font-size: 15px;\">data=data3;<\/b> <\/pre>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-36026\" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/fuzz3.png\" alt=\"voorbeeld van fuzzy matching in SAS\" width=\"337\" height=\"187\" srcset=\"\" sizes=\"auto, \"><\/p>\n<p> <span style=\"color: #000000;\">De <strong>SOUNDEX-<\/strong> en <strong>COMPGED-<\/strong> functies kunnen teamnamen matchen op basis van hun gelijkenis en een definitieve dataset produceren die de twee datasets samenvoegt.<\/span><\/p>\n<h2> <span style=\"color: #000000;\"><strong>Aanvullende bronnen<\/strong><\/span><\/h2>\n<p> <span style=\"color: #000000;\">In de volgende zelfstudies wordt uitgelegd hoe u andere veelvoorkomende taken in SAS kunt uitvoeren:<\/span><\/p>\n<p> <a href=\"https:\/\/statorials.org\/nl\/zonder-een-met-velen-samen-te-voegen\/\" target=\"_blank\" rel=\"noopener\">SAS: Hoe u een \u00e9\u00e9n-op-veel-samenvoeging uitvoert<\/a><br \/> <a href=\"https:\/\/statorials.org\/nl\/niet-samenvoegen-in-a-in-b\/\" target=\"_blank\" rel=\"noopener\">SAS: Hoe (in=a) te gebruiken in een merge-instructie<\/a><br \/> <a href=\"https:\/\/statorials.org\/nl\/niet-samenvoegen-als-a-niet-b\/\" target=\"_blank\" rel=\"noopener\">SAS: Hoe te fuseren als A niet B is<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Vaak wilt u mogelijk twee sets gegevens samenvoegen in SAS op basis van niet perfect overeenkomende tekenreeksen. Dit wordt vaak fuzzy matching genoemd. De eenvoudigste manier om fuzzy matching uit te voeren in SAS is door de SOUNDEX- functie te gebruiken met de COMPGED- functie. Deze twee functies worden gebruikt om de gelijkenis tussen strings [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"class_list":["post-4619","post","type-post","status-publish","format-standard","hentry","category-gids"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Fuzzy Matching uitvoeren in SAS (met voorbeeld) - Statorials<\/title>\n<meta name=\"description\" content=\"In deze zelfstudie wordt aan de hand van een voorbeeld uitgelegd hoe u fuzzy matching in SAS uitvoert.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/nl\/vage-correspondentie-in-de-luchtsluis\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Fuzzy Matching uitvoeren in SAS (met voorbeeld) - Statorials\" \/>\n<meta property=\"og:description\" content=\"In deze zelfstudie wordt aan de hand van een voorbeeld uitgelegd hoe u fuzzy matching in SAS uitvoert.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/nl\/vage-correspondentie-in-de-luchtsluis\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-09T14:26:52+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/fuzz1.png\" \/>\n<meta name=\"author\" content=\"Dr.benjamin anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"Dr.benjamin anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"2\u00a0Minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/nl\/vage-correspondentie-in-de-luchtsluis\/\",\"url\":\"https:\/\/statorials.org\/nl\/vage-correspondentie-in-de-luchtsluis\/\",\"name\":\"Fuzzy Matching uitvoeren in SAS (met voorbeeld) - Statorials\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/nl\/#website\"},\"datePublished\":\"2023-07-09T14:26:52+00:00\",\"dateModified\":\"2023-07-09T14:26:52+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\"},\"description\":\"In deze zelfstudie wordt aan de hand van een voorbeeld uitgelegd hoe u fuzzy matching in SAS uitvoert.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/nl\/vage-correspondentie-in-de-luchtsluis\/#breadcrumb\"},\"inLanguage\":\"de\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/nl\/vage-correspondentie-in-de-luchtsluis\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/nl\/vage-correspondentie-in-de-luchtsluis\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Thuis\",\"item\":\"https:\/\/statorials.org\/nl\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Fuzzy matching uitvoeren in sas (met voorbeeld)\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/nl\/#website\",\"url\":\"https:\/\/statorials.org\/nl\/\",\"name\":\"Statorials\",\"description\":\"Uw gids voor statistische competentie\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/nl\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"de\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\",\"name\":\"Dr.benjamin anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/\",\"url\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"caption\":\"Dr.benjamin anderson\"},\"description\":\"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder\",\"sameAs\":[\"http:\/\/statorials.org\/nl\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Fuzzy Matching uitvoeren in SAS (met voorbeeld) - Statorials","description":"In deze zelfstudie wordt aan de hand van een voorbeeld uitgelegd hoe u fuzzy matching in SAS uitvoert.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/nl\/vage-correspondentie-in-de-luchtsluis\/","og_locale":"de_DE","og_type":"article","og_title":"Fuzzy Matching uitvoeren in SAS (met voorbeeld) - Statorials","og_description":"In deze zelfstudie wordt aan de hand van een voorbeeld uitgelegd hoe u fuzzy matching in SAS uitvoert.","og_url":"https:\/\/statorials.org\/nl\/vage-correspondentie-in-de-luchtsluis\/","og_site_name":"Statorials","article_published_time":"2023-07-09T14:26:52+00:00","og_image":[{"url":"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/fuzz1.png"}],"author":"Dr.benjamin anderson","twitter_card":"summary_large_image","twitter_misc":{"Verfasst von":"Dr.benjamin anderson","Gesch\u00e4tzte Lesezeit":"2\u00a0Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/nl\/vage-correspondentie-in-de-luchtsluis\/","url":"https:\/\/statorials.org\/nl\/vage-correspondentie-in-de-luchtsluis\/","name":"Fuzzy Matching uitvoeren in SAS (met voorbeeld) - Statorials","isPartOf":{"@id":"https:\/\/statorials.org\/nl\/#website"},"datePublished":"2023-07-09T14:26:52+00:00","dateModified":"2023-07-09T14:26:52+00:00","author":{"@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219"},"description":"In deze zelfstudie wordt aan de hand van een voorbeeld uitgelegd hoe u fuzzy matching in SAS uitvoert.","breadcrumb":{"@id":"https:\/\/statorials.org\/nl\/vage-correspondentie-in-de-luchtsluis\/#breadcrumb"},"inLanguage":"de","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/nl\/vage-correspondentie-in-de-luchtsluis\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/nl\/vage-correspondentie-in-de-luchtsluis\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Thuis","item":"https:\/\/statorials.org\/nl\/"},{"@type":"ListItem","position":2,"name":"Fuzzy matching uitvoeren in sas (met voorbeeld)"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/nl\/#website","url":"https:\/\/statorials.org\/nl\/","name":"Statorials","description":"Uw gids voor statistische competentie","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/nl\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"de"},{"@type":"Person","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219","name":"Dr.benjamin anderson","image":{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/","url":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","contentUrl":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","caption":"Dr.benjamin anderson"},"description":"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder","sameAs":["http:\/\/statorials.org\/nl"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/4619","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/comments?post=4619"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/4619\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/media?parent=4619"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/categories?post=4619"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/tags?post=4619"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}