{"id":4620,"date":"2023-07-09T14:23:19","date_gmt":"2023-07-09T14:23:19","guid":{"rendered":"https:\/\/statorials.org\/nl\/sas-proc-cluster\/"},"modified":"2023-07-09T14:23:19","modified_gmt":"2023-07-09T14:23:19","slug":"sas-proc-cluster","status":"publish","type":"post","link":"https:\/\/statorials.org\/nl\/sas-proc-cluster\/","title":{"rendered":"Proc cluster gebruiken in sas (met voorbeeld)"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\"><strong>Clustering<\/strong> is een machine learning-techniek die probeert groepen <a href=\"https:\/\/statorials.org\/nl\/observatie-in-de-statistiek\/\" target=\"_blank\" rel=\"noopener noreferrer\">observaties<\/a> binnen een dataset te vinden.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Het doel is om clusters zo te vinden dat waarnemingen binnen elke cluster behoorlijk op elkaar lijken, terwijl waarnemingen in verschillende clusters behoorlijk van elkaar verschillen.<\/span><\/p>\n<p> <span style=\"color: #000000;\">De eenvoudigste manier om te clusteren in SAS is door <strong>PROC CLUSTER<\/strong> te gebruiken.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Het volgende voorbeeld laat zien hoe u <strong>PROC CLUSTER<\/strong> in de praktijk kunt gebruiken.<\/span><\/p>\n<h2> <span style=\"color: #000000;\"><strong>Voorbeeld: PROC CLUSTER gebruiken in SAS<\/strong><\/span><\/h2>\n<p> <span style=\"color: #000000;\">Laten we zeggen dat we de volgende dataset hebben met informatie over punten, assists en rebounds voor 20 verschillende basketbalspelers:<\/span> <\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <span style=\"color: #000000;\"><strong><span style=\"color: #008000;\">\/*create dataset*\/             \n<span style=\"color: #800080;\">data<\/span><\/span> my_data;\n    <span style=\"color: #3366ff;\">input<\/span> points assists rebounds;   \n    <span style=\"color: #3366ff;\">datalines<\/span> ;\n18 3 15\n20 3 14\n19 4 14\n14 5 10\n14 4 8\n15 7 14\n20 8 13\n28 7 9\n30 6 5\n31 9 4\n35 12 11\n33 14 6\n29 9 5\n25 9 5\n25 4 3\n27 3 8\n29 4 12\n30 12 7\n19 5 6\n23 11 5\n;\n<span style=\"color: #800080;\">run<\/span> ;\n\n<span style=\"color: #008000;\">\/*view dataset*\/ \n<\/span><span style=\"color: #800080;\">proc print<\/span> <span style=\"color: #3366ff;\">data<\/span> =my_data;\n<\/strong><\/span><\/pre>\n<p><img decoding=\"async\" loading=\"lazy\" class=\" wp-image-36039 aligncenter\" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/clusters0.png\" alt=\"\" width=\"312\" height=\"513\" srcset=\"\" sizes=\"auto, \"><\/p>\n<p> <span style=\"color: #000000;\">Laten we zeggen dat we een groepering willen uitvoeren om te proberen &#8218;clusters&#8216; van spelers met vergelijkbare statistieken te identificeren.<\/span><\/p>\n<p> <span style=\"color: #000000;\">De volgende code laat zien hoe u <strong>PROC CLUSTER<\/strong> in SAS gebruikt om clustering uit te voeren:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <span style=\"color: #000000;\"><strong><span style=\"color: #008000;\">\/*perform clustering using points, assists and rebounds variables*\/             \n<span style=\"color: #000000;\"><span style=\"color: #800080;\">proc cluster<\/span> <span style=\"color: #3366ff;\">data<\/span> =my_data <span style=\"color: #3366ff;\">method<\/span> =average;<\/span>\n<span style=\"color: #000000;\"><span style=\"color: #3366ff;\">var<\/span> points assists rebounds;<\/span>\n<span style=\"color: #000000;\"><span style=\"color: #800080;\">run<\/span> ;<\/span>\n<\/span><\/strong><\/span><\/pre>\n<p> <span style=\"color: #000000;\">De eerste tabellen met het resultaat geven informatie over hoe de clustering werd uitgevoerd:<\/span> <\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\" wp-image-36033 aligncenter\" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/clusters1.png\" alt=\"\" width=\"342\" height=\"728\" srcset=\"\" sizes=\"auto, \"><\/p>\n<p> <span style=\"color: #000000;\">Er wordt ook een dendrogram gemaakt, zodat we de gelijkenis tussen waarnemingen in de dataset visueel kunnen inspecteren:<\/span> <\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\" wp-image-36034 aligncenter\" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/clusters2.png\" alt=\"\" width=\"584\" height=\"439\" srcset=\"\" sizes=\"auto, \"><\/p>\n<p> <span style=\"color: #000000;\">De y-as toont individuele waarnemingen en de x-as toont de gemiddelde afstand tussen clusters.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Als we naar dit dendrogram kijken, lijkt het erop dat de waarnemingen uiteraard in drie groepen vallen:<\/span> <\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-36035\" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/clusters3.png\" alt=\"Voorbeeld van SAS PROC-CLUSTER\" width=\"573\" height=\"423\" srcset=\"\" sizes=\"auto, \"><\/p>\n<p> <span style=\"color: #000000;\">We kunnen vervolgens de <strong>PROC TREE<\/strong> -instructie met <strong>ncl=3<\/strong> gebruiken om SAS te vertellen elke waarneming in de oorspronkelijke dataset toe te wijzen aan een van de drie clusters:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <span style=\"color: #000000;\"><strong><span style=\"color: #008000;\">\/*assign each observation to one of three clusters*\/\n<\/span><span style=\"color: #800080;\">proc tree<\/span> <span style=\"color: #3366ff;\">data<\/span> =clustd <span style=\"color: #3366ff;\">noprint ncl<\/span> =3 <span style=\"color: #3366ff;\">out<\/span> =clusts;\n    <span style=\"color: #3366ff;\">copy<\/span> points assists rebounds;\n    <span style=\"color: #3366ff;\">id<\/span> player_ID;\n<span style=\"color: #800080;\">run<\/span> ;\n<span style=\"color: #800080;\">proc sort<\/span> ;\n   <span style=\"color: #3366ff;\">by<\/span> cluster;\n<span style=\"color: #800080;\">run<\/span> ;\n\n<span style=\"color: #008000;\">\/*view cluster assignments*\/\n<\/span><span style=\"color: #800080;\">proc print<\/span> <span style=\"color: #3366ff;\">data<\/span> = clusters;\n    <span style=\"color: #3366ff;\">id<\/span> player_ID;\n<span style=\"color: #800080;\">run<\/span> ;<\/strong><\/span><\/pre>\n<p> <span style=\"color: #000000;\">De resulterende dataset toont elk van de oorspronkelijke waarnemingen samen met het cluster waartoe ze behoren:<\/span> <\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\" wp-image-36036 aligncenter\" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/clusters4.png\" alt=\"\" width=\"415\" height=\"489\" srcset=\"\" sizes=\"auto, \"><\/p>\n<p> <span style=\"color: #000000;\">We kunnen bijvoorbeeld zien: dat spelers<\/span> <span style=\"color: #000000;\">met ID&#8217;s 2, 3, 1, 4, 5, 7, 6 en 19 allemaal tot cluster <strong>1<\/strong> behoren.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Dit vertelt ons dat deze acht spelers \u201cvergelijkbaar\u201d zijn in termen van punten, assists en rebounds-variabelen.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Opmerking<\/strong> : voor dit voorbeeld hebben we ervoor gekozen om <strong>middeling<\/strong> te gebruiken als koppelingsmethode voor clustering. Raadpleeg de <a href=\"https:\/\/documentation.sas.com\/doc\/en\/pgmsascdc\/9.4_3.4\/statug\/statug_cluster_syntax01.htm\" target=\"_blank\" rel=\"noopener\">SAS-documentatie<\/a> voor een volledige lijst met andere bindingsmethoden die u kunt gebruiken.<\/span><\/p>\n<h2> <span style=\"color: #000000;\"><strong>Aanvullende bronnen<\/strong><\/span><\/h2>\n<p> <span style=\"color: #000000;\">In de volgende zelfstudies wordt uitgelegd hoe u andere veelvoorkomende taken in SAS kunt uitvoeren:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><a href=\"https:\/\/statorials.org\/nl\/hoofdcomponentenanalyse-in-sas\/\" target=\"_blank\" rel=\"noopener\">Hoofdcomponentanalyse uitvoeren in SAS<\/a><br \/> <a href=\"https:\/\/statorials.org\/nl\/meervoudige-lineaire-regressie-in-sas\/\" target=\"_blank\" rel=\"noopener\">Hoe u meerdere lineaire regressie uitvoert in SAS<\/a><br \/> <a href=\"https:\/\/statorials.org\/nl\/logistische-regressie-in-de-luchtsluis\/\" target=\"_blank\" rel=\"noopener\">Hoe logistische regressie uit te voeren in SAS<\/a><\/span><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Clustering is een machine learning-techniek die probeert groepen observaties binnen een dataset te vinden. Het doel is om clusters zo te vinden dat waarnemingen binnen elke cluster behoorlijk op elkaar lijken, terwijl waarnemingen in verschillende clusters behoorlijk van elkaar verschillen. De eenvoudigste manier om te clusteren in SAS is door PROC CLUSTER te gebruiken. Het [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"class_list":["post-4620","post","type-post","status-publish","format-standard","hentry","category-gids"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Hoe PROC CLUSTER in SAS te gebruiken (met voorbeeld) - Statorials<\/title>\n<meta name=\"description\" content=\"In deze zelfstudie wordt aan de hand van een voorbeeld uitgelegd hoe u PROC CLUSTER in SAS kunt gebruiken om clusteranalyses uit te voeren.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/nl\/sas-proc-cluster\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Hoe PROC CLUSTER in SAS te gebruiken (met voorbeeld) - Statorials\" \/>\n<meta property=\"og:description\" content=\"In deze zelfstudie wordt aan de hand van een voorbeeld uitgelegd hoe u PROC CLUSTER in SAS kunt gebruiken om clusteranalyses uit te voeren.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/nl\/sas-proc-cluster\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-09T14:23:19+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/clusters0.png\" \/>\n<meta name=\"author\" content=\"Dr.benjamin anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"Dr.benjamin anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"2\u00a0Minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/nl\/sas-proc-cluster\/\",\"url\":\"https:\/\/statorials.org\/nl\/sas-proc-cluster\/\",\"name\":\"Hoe PROC CLUSTER in SAS te gebruiken (met voorbeeld) - Statorials\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/nl\/#website\"},\"datePublished\":\"2023-07-09T14:23:19+00:00\",\"dateModified\":\"2023-07-09T14:23:19+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\"},\"description\":\"In deze zelfstudie wordt aan de hand van een voorbeeld uitgelegd hoe u PROC CLUSTER in SAS kunt gebruiken om clusteranalyses uit te voeren.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/nl\/sas-proc-cluster\/#breadcrumb\"},\"inLanguage\":\"de\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/nl\/sas-proc-cluster\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/nl\/sas-proc-cluster\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Thuis\",\"item\":\"https:\/\/statorials.org\/nl\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Proc cluster gebruiken in sas (met voorbeeld)\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/nl\/#website\",\"url\":\"https:\/\/statorials.org\/nl\/\",\"name\":\"Statorials\",\"description\":\"Uw gids voor statistische competentie\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/nl\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"de\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\",\"name\":\"Dr.benjamin anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/\",\"url\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"caption\":\"Dr.benjamin anderson\"},\"description\":\"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder\",\"sameAs\":[\"http:\/\/statorials.org\/nl\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Hoe PROC CLUSTER in SAS te gebruiken (met voorbeeld) - Statorials","description":"In deze zelfstudie wordt aan de hand van een voorbeeld uitgelegd hoe u PROC CLUSTER in SAS kunt gebruiken om clusteranalyses uit te voeren.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/nl\/sas-proc-cluster\/","og_locale":"de_DE","og_type":"article","og_title":"Hoe PROC CLUSTER in SAS te gebruiken (met voorbeeld) - Statorials","og_description":"In deze zelfstudie wordt aan de hand van een voorbeeld uitgelegd hoe u PROC CLUSTER in SAS kunt gebruiken om clusteranalyses uit te voeren.","og_url":"https:\/\/statorials.org\/nl\/sas-proc-cluster\/","og_site_name":"Statorials","article_published_time":"2023-07-09T14:23:19+00:00","og_image":[{"url":"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/clusters0.png"}],"author":"Dr.benjamin anderson","twitter_card":"summary_large_image","twitter_misc":{"Verfasst von":"Dr.benjamin anderson","Gesch\u00e4tzte Lesezeit":"2\u00a0Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/nl\/sas-proc-cluster\/","url":"https:\/\/statorials.org\/nl\/sas-proc-cluster\/","name":"Hoe PROC CLUSTER in SAS te gebruiken (met voorbeeld) - Statorials","isPartOf":{"@id":"https:\/\/statorials.org\/nl\/#website"},"datePublished":"2023-07-09T14:23:19+00:00","dateModified":"2023-07-09T14:23:19+00:00","author":{"@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219"},"description":"In deze zelfstudie wordt aan de hand van een voorbeeld uitgelegd hoe u PROC CLUSTER in SAS kunt gebruiken om clusteranalyses uit te voeren.","breadcrumb":{"@id":"https:\/\/statorials.org\/nl\/sas-proc-cluster\/#breadcrumb"},"inLanguage":"de","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/nl\/sas-proc-cluster\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/nl\/sas-proc-cluster\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Thuis","item":"https:\/\/statorials.org\/nl\/"},{"@type":"ListItem","position":2,"name":"Proc cluster gebruiken in sas (met voorbeeld)"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/nl\/#website","url":"https:\/\/statorials.org\/nl\/","name":"Statorials","description":"Uw gids voor statistische competentie","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/nl\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"de"},{"@type":"Person","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219","name":"Dr.benjamin anderson","image":{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/","url":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","contentUrl":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","caption":"Dr.benjamin anderson"},"description":"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder","sameAs":["http:\/\/statorials.org\/nl"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/4620","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/comments?post=4620"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/4620\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/media?parent=4620"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/categories?post=4620"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/tags?post=4620"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}