{"id":1244,"date":"2023-07-27T04:03:40","date_gmt":"2023-07-27T04:03:40","guid":{"rendered":"https:\/\/statorials.org\/nl\/k-betekent-groeperen-in-r\/"},"modified":"2023-07-27T04:03:40","modified_gmt":"2023-07-27T04:03:40","slug":"k-betekent-groeperen-in-r","status":"publish","type":"post","link":"https:\/\/statorials.org\/nl\/k-betekent-groeperen-in-r\/","title":{"rendered":"K-betekent clustering in r: stapsgewijs voorbeeld"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\">Clustering is een machine learning-techniek die probeert <em>groepen<\/em> <a href=\"https:\/\/statorials.org\/nl\/observatie-in-de-statistiek\/\" target=\"_blank\" rel=\"noopener noreferrer\">observaties<\/a> binnen een dataset te vinden.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Het doel is om clusters zo te vinden dat waarnemingen binnen elke cluster behoorlijk op elkaar lijken, terwijl waarnemingen in verschillende clusters behoorlijk van elkaar verschillen.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Clustering is een vorm van <a href=\"https:\/\/statorials.org\/nl\/begeleid-versus-onbewaakt-leren\/\" target=\"_blank\" rel=\"noopener noreferrer\">leren zonder toezicht<\/a> , omdat we eenvoudigweg structuur proberen te vinden binnen een dataset in plaats van de waarde van een <a href=\"https:\/\/statorials.org\/nl\/variabelen-verklarende-reacties\/\" target=\"_blank\" rel=\"noopener noreferrer\">responsvariabele<\/a> te voorspellen.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Clustering wordt vaak gebruikt in marketing wanneer bedrijven toegang hebben tot informatie zoals:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Huishoudelijk inkomen<\/span><\/li>\n<li> <span style=\"color: #000000;\">Grootte van het huishouden<\/span><\/li>\n<li> <span style=\"color: #000000;\">Beroep hoofd huishouden<\/span><\/li>\n<li> <span style=\"color: #000000;\">Afstand tot het dichtstbijzijnde stedelijke gebied<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Wanneer deze informatie beschikbaar is, kan clustering worden gebruikt om huishoudens te identificeren die vergelijkbaar zijn en waarbij de kans groter is dat ze bepaalde producten kopen of beter reageren op een bepaald soort reclame.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Een van de meest voorkomende vormen van clustering staat bekend als <strong>k-means clustering<\/strong> .<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Wat is K-Means-clustering?<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">K-means clustering is een techniek waarbij we elke waarneming uit een dataset in een van <em>de K-<\/em> clusters plaatsen.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Het einddoel is om <em>K-<\/em> clusters te hebben waarin waarnemingen binnen elke cluster behoorlijk op elkaar lijken, terwijl waarnemingen in verschillende clusters behoorlijk van elkaar verschillen.<\/span><\/p>\n<p> <span style=\"color: #000000;\">In de praktijk gebruiken we de volgende stappen om K-means clustering uit te voeren:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>1. Kies een waarde voor <em>K.<\/em><\/strong><\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Eerst moeten we beslissen hoeveel clusters we in de gegevens willen identificeren. Vaak hoeven we eenvoudigweg verschillende waarden voor <em>K<\/em> te testen en de resultaten te analyseren om te zien welk aantal clusters het meest logisch lijkt voor een bepaald probleem.<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\"><strong>2. Wijs elke waarneming willekeurig toe aan een eerste cluster, van 1 tot <em>K.<\/em><\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>3. Voer de volgende procedure uit totdat de clustertoewijzingen niet meer veranderen.<\/strong><\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Bereken voor elk van de <em>K-<\/em> clusters het <em>zwaartepunt van het cluster.<\/em> Dit is eenvoudigweg de vector van <em>p-<\/em> gemiddelde kenmerken voor de waarnemingen van de <em>k-<\/em> de cluster.<\/span><\/li>\n<li> <span style=\"color: #000000;\">Wijs elke waarneming toe aan het cluster met het dichtstbijzijnde zwaartepunt. Hier wordt <em>de dichtstbijzijnde<\/em> gedefinieerd met behulp van <a href=\"https:\/\/en.wikipedia.org\/wiki\/Euclidean_distance#Squared_Euclidean_distance\" target=\"_blank\" rel=\"noopener noreferrer\">de Euclidische afstand<\/a> .<\/span><\/li>\n<\/ul>\n<h3> <span style=\"color: #000000;\"><strong>K-betekent clustering in R<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">De volgende zelfstudie biedt een stapsgewijs voorbeeld van het uitvoeren van k-means-clustering in R.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Stap 1: Laad de benodigde pakketten<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Eerst zullen we twee pakketten laden die verschillende nuttige functies bevatten voor k-means clustering in R.<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #993300;\">library<\/span> (factoextra)\n<span style=\"color: #993300;\">library<\/span> (cluster)<\/strong><\/pre>\n<h3> <span style=\"color: #000000;\"><strong>Stap 2: Gegevens laden en voorbereiden<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Voor dit voorbeeld gebruiken we de <em>USArrests-<\/em> gegevensset die is ingebouwd in R, die het aantal arrestaties per 100.000 mensen in elke Amerikaanse staat in 1973 bevat voor <em>moord<\/em> , <em>aanranding<\/em> en <em>verkrachting<\/em> , evenals het percentage van de bevolking van elke staat dat in stedelijke gebieden woont. gebieden. , <em>UrbanPop<\/em> .<\/span><\/p>\n<p> <span style=\"color: #000000;\">De volgende code laat zien hoe u het volgende kunt doen:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Laad <em>USArrests-<\/em> gegevensset<\/span><\/li>\n<li> <span style=\"color: #000000;\">Verwijder alle rijen met ontbrekende waarden<\/span><\/li>\n<li> <span style=\"color: #000000;\">Schaal elke variabele in de dataset zodat deze een gemiddelde van 0 en een standaarddeviatie van 1 heeft<\/span><\/li>\n<\/ul>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#load data<\/span>\ndf &lt;-USArrests\n\n<span style=\"color: #008080;\">#remove rows with missing values<\/span><\/strong>\n<strong>df &lt;- na. <span style=\"color: #3366ff;\">omitted<\/span> (df)\n\n<span style=\"color: #008080;\">#scale each variable to have a mean of 0 and sd of 1<\/span><\/strong>\n<strong>df &lt;- scale(df)\n\n<span style=\"color: #008080;\">#view first six rows of dataset<\/span>\nhead(df)\n\n               Murder Assault UrbanPop Rape\nAlabama 1.24256408 0.7828393 -0.5209066 -0.003416473\nAlaska 0.50786248 1.1068225 -1.2117642 2.484202941\nArizona 0.07163341 1.4788032 0.9989801 1.042878388\nArkansas 0.23234938 0.2308680 -1.0735927 -0.184916602\nCalifornia 0.27826823 1.2628144 1.7589234 2.067820292\nColorado 0.02571456 0.3988593 0.8608085 1.864967207\n<\/strong><\/pre>\n<h3> <span style=\"color: #000000;\"><strong>Stap 3: Vind het optimale aantal clusters<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Om k-means-clustering in R uit te voeren, kunnen we de ingebouwde <strong>kmeans()-<\/strong> functie gebruiken, die de volgende syntaxis gebruikt:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>kmeans (data, centra, nstart)<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Goud:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\"><strong>gegevens:<\/strong> naam van de gegevensset.<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>centra:<\/strong> Het aantal clusters, aangeduid met <em>k<\/em> .<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>nstart:<\/strong> het aantal initi\u00eble configuraties. Omdat het mogelijk is dat verschillende initi\u00eble startclusters tot verschillende resultaten leiden, wordt aanbevolen om meerdere verschillende initi\u00eble configuraties te gebruiken. Het k-means-algoritme zal de initi\u00eble configuraties vinden die tot de kleinste variatie binnen het cluster leiden.<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Omdat we van tevoren niet weten hoeveel clusters optimaal zijn, maken we twee verschillende grafieken die ons kunnen helpen beslissen:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>1. Aantal clusters ten opzichte van totaal in som van kwadraten<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Eerst gebruiken we de functie <strong>fviz_nblust()<\/strong> om een grafiek te maken van het aantal clusters versus het totaal in de som van de kwadraten:<\/span> <\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong>fviz_nbclust(df, kmeans, method = \u201c <span style=\"color: #008000;\">wss<\/span> \u201d)<\/strong> <\/pre>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-12310 \" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/kmmoyenne1.png\" alt=\"Optimaal aantal clusters in k-betekent clustering\" width=\"444\" height=\"434\" srcset=\"\" sizes=\"auto, \"><\/p>\n<p> <span style=\"color: #000000;\">Wanneer we dit type plot maken, zoeken we doorgaans naar een \u2018knie\u2019 waar de som van de vierkanten begint te \u2018buigen\u2019 of af te vlakken. Dit is doorgaans het optimale aantal clusters.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Voor deze grafiek lijkt het erop dat er een kleine knik of &#8222;buiging&#8220; is bij k = 4 clusters.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>2. Aantal clusters versus gap-statistieken<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Een andere manier om het optimale aantal clusters te bepalen is door een metriek te gebruiken die <a style=\"color: #000000;\" href=\"https:\/\/web.stanford.edu\/~hastie\/Papers\/gap.pdf\" target=\"_blank\" rel=\"noopener noreferrer\">de afwijkingsstatistiek<\/a> wordt genoemd, die de totale intra-clustervariatie voor verschillende waarden van k vergelijkt met hun verwachte waarden voor een verdeling zonder clustering.<\/span><\/p>\n<p> <span style=\"color: #000000;\">We kunnen de gap-statistiek voor elk aantal clusters berekenen met behulp van de <strong>clusGap()-<\/strong> functie uit het <em>clusterpakket<\/em> , en de clusters uitzetten tegen de gap-statistieken met behulp van de <strong>fviz_gap_stat()-<\/strong> functie:<\/span> <\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#calculate gap statistic based on number of clusters\n<\/span>gap_stat &lt;- clusGap(df,\n                    FUN = kmeans,\n                    nstart = 25,\n                    K.max = 10,\n                    B = 50)\n\n<span style=\"color: #008080;\">#plot number of clusters vs. gap statistic\n<\/span>fviz_gap_stat(gap_stat)<\/strong> <\/pre>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-12311 \" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/moyenne-km2.png\" alt=\"Afwijkingsstatistiek voor optimaal aantal clusters\" width=\"454\" height=\"445\" srcset=\"\" sizes=\"auto, \"><\/p>\n<p> <span style=\"color: #000000;\">Uit de grafiek kunnen we zien dat de gap-statistiek het hoogst is bij k = 4 clusters, wat overeenkomt met de elleboogmethode die we eerder hebben gebruikt.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Stap 4: Voer K-Means Clustering uit met Optimal <em>K<\/em><\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Ten slotte kunnen we k-means clustering uitvoeren op de dataset met behulp van de optimale waarde voor <em>k<\/em> van 4:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#make this example reproducible\n<span style=\"color: #000000;\">set.seed(1)<\/span>\n\n#perform k-means clustering with k = 4 clusters\n<\/span>km &lt;- kmeans(df, centers = 4, nstart = 25)\n\n<span style=\"color: #008080;\">#view results\n<\/span>km\n\nK-means clustering with 4 clusters of sizes 16, 13, 13, 8\n\nCluster means:\n      Murder Assault UrbanPop Rape\n1 -0.4894375 -0.3826001 0.5758298 -0.26165379\n2 -0.9615407 -1.1066010 -0.9301069 -0.96676331\n3 0.6950701 1.0394414 0.7226370 1.27693964\n4 1.4118898 0.8743346 -0.8145211 0.01927104\n\nVector clustering:\n       Alabama Alaska Arizona Arkansas California Colorado \n             4 3 3 4 3 3 \n   Connecticut Delaware Florida Georgia Hawaii Idaho \n             1 1 3 4 1 2 \n      Illinois Indiana Iowa Kansas Kentucky Louisiana \n             3 1 2 1 2 4 \n         Maine Maryland Massachusetts Michigan Minnesota Mississippi \n             2 3 1 3 2 4 \n      Missouri Montana Nebraska Nevada New Hampshire New Jersey \n             3 2 2 3 2 1 \n    New Mexico New York North Carolina North Dakota Ohio Oklahoma \n             3 3 4 2 1 1 \n        Oregon Pennsylvania Rhode Island South Carolina South Dakota Tennessee \n             1 1 1 4 2 4 \n         Texas Utah Vermont Virginia Washington West Virginia \n             3 1 2 1 1 2 \n     Wisconsin Wyoming \n             2 1 \n\nWithin cluster sum of squares by cluster:\n[1] 16.212213 11.952463 19.922437 8.316061\n (between_SS \/ total_SS = 71.2%)\n\nAvailable components:\n\n[1] \"cluster\" \"centers\" \"totss\" \"withinss\" \"tot.withinss\" \"betweenss\"   \n[7] \"size\" \"iter\" \"ifault\"         \n<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Uit de resultaten kunnen we zien dat:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Aan het eerste cluster werden <b>16<\/b> staten toegewezen<\/span><\/li>\n<li> <span style=\"color: #000000;\">Er zijn <strong>13<\/strong> staten toegewezen aan het tweede cluster<\/span><\/li>\n<li> <span style=\"color: #000000;\">Er zijn <strong>13<\/strong> staten toegewezen aan het derde cluster<\/span><\/li>\n<li> <span style=\"color: #000000;\">Er zijn <b>8<\/b> staten toegewezen aan het vierde cluster<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">We kunnen de clusters visualiseren op een spreidingsdiagram dat de eerste twee hoofdcomponenten op de assen weergeeft met behulp van de <strong>fivz_cluster()<\/strong> functie:<\/span> <\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#plot results of final k-means model\n<span style=\"color: #000000;\">fviz_cluster(km, data = df)\n<\/span><\/span><\/strong><\/pre>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-12313 \" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/kmmoyenne4.png\" alt=\"K betekent clusterplot in R\" width=\"475\" height=\"472\" srcset=\"\" sizes=\"auto, \"><\/p>\n<p> <span style=\"color: #000000;\">We kunnen ook de functie <strong>Aggregate()<\/strong> gebruiken om het gemiddelde van de variabelen in elk cluster te vinden:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#find means of each cluster\n<span style=\"color: #000000;\">aggregate(USArrests, by= <span style=\"color: #3366ff;\">list<\/span> (cluster=km$cluster), mean)\n\ncluster Murder Assault UrbanPop Rape\n\t\t\t\t\n1 3.60000 78.53846 52.07692 12.17692\n2 10.81538 257.38462 76.00000 33.19231\n3 5.65625 138.87500 73.87500 18.78125\n4 13.93750 243.62500 53.75000 21.41250\n<\/span><\/span><\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Deze output interpreteren wij als volgt:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Het gemiddelde aantal moorden per 100.000 burgers in de staten van Groep 1 bedraagt <strong>3,6<\/strong> .<\/span><\/li>\n<li> <span style=\"color: #000000;\">Het gemiddelde aantal aanvallen per 100.000 burgers in de landen van Groep 1 bedraagt <strong>78,5<\/strong> .<\/span><\/li>\n<li> <span style=\"color: #000000;\">Het gemiddelde percentage inwoners dat in een stedelijk gebied woont in de staten van Groep 1 is <b>52,1%<\/b> .<\/span><\/li>\n<li> <span style=\"color: #000000;\">Het gemiddelde aantal verkrachtingen per 100.000 burgers in de landen van Groep 1 bedraagt <strong>12,2<\/strong> <strong>.<\/strong><\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Enzovoort.<\/span><\/p>\n<p> <span style=\"color: #000000;\">We kunnen ook de clustertoewijzingen van elke staat toevoegen aan de originele dataset:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#add cluster assignment to original data\n<span style=\"color: #000000;\">final_data &lt;- cbind(USArrests, cluster = km$cluster)\n<\/span>\n#view final data\n<span style=\"color: #000000;\">head(final_data)\n\n\t<\/span><span style=\"color: #000000;\">Murder Assault UrbanPop<\/span> <span style=\"color: #000000;\">Rape<\/span> <span style=\"color: #000000;\">cluster\n\t\t\t\t\nAlabama<\/span> <span style=\"color: #000000;\">13.2<\/span> <span style=\"color: #000000;\">236 58<\/span> <span style=\"color: #000000;\">21.2<\/span> <span style=\"color: #000000;\">4\nAlaska<\/span> <span style=\"color: #000000;\">10.0 263 48<\/span> <span style=\"color: #000000;\">44.5<\/span> <span style=\"color: #000000;\">2\nArizona<\/span> <span style=\"color: #000000;\">8.1 294 80<\/span> <span style=\"color: #000000;\">31.0<\/span> <span style=\"color: #000000;\">2\nArkansas<\/span> <span style=\"color: #000000;\">8.8 190 50<\/span> <span style=\"color: #000000;\">19.5<\/span> <span style=\"color: #000000;\">4\nCalifornia<\/span> <span style=\"color: #000000;\">9.0 276 91<\/span> <span style=\"color: #000000;\">40.6<\/span> <span style=\"color: #000000;\">2\nColorado<\/span> <span style=\"color: #000000;\">7.9 204 78<\/span> <span style=\"color: #000000;\">38.7<\/span> <span style=\"color: #000000;\">2\n<\/span><\/span><\/strong><\/pre>\n<h3> <span style=\"color: #000000;\"><strong>Voor- en nadelen van K-Means-clustering<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">K-means clustering biedt de volgende voordelen:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Het is een snel algoritme.<\/span><\/li>\n<li> <span style=\"color: #000000;\">Het kan grote datasets goed verwerken.<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Het heeft echter de volgende potenti\u00eble nadelen:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Dit vereist dat we het aantal clusters specificeren voordat het algoritme wordt uitgevoerd.<\/span><\/li>\n<li> <span style=\"color: #000000;\">Het is gevoelig voor uitschieters.<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Twee alternatieven voor k-means-clustering zijn <a href=\"https:\/\/statorials.org\/nl\/k-medoiden-in-r\/\" target=\"_blank\" rel=\"noopener noreferrer\">k-means-clustering<\/a> en hi\u00ebrarchische clustering.<\/span><\/p>\n<hr>\n<p> <span style=\"color: #000000;\">De volledige R-code die in dit voorbeeld wordt gebruikt, vindt u <a href=\"https:\/\/github.com\/Statorials\/R-Guides\/blob\/main\/k_means.R\" target=\"_blank\" rel=\"noopener noreferrer\">hier<\/a> .<\/span><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Clustering is een machine learning-techniek die probeert groepen observaties binnen een dataset te vinden. Het doel is om clusters zo te vinden dat waarnemingen binnen elke cluster behoorlijk op elkaar lijken, terwijl waarnemingen in verschillende clusters behoorlijk van elkaar verschillen. Clustering is een vorm van leren zonder toezicht , omdat we eenvoudigweg structuur proberen te [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"class_list":["post-1244","post","type-post","status-publish","format-standard","hentry","category-gids"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>K-betekent clustering in R: stapsgewijs voorbeeld - Statorials<\/title>\n<meta name=\"description\" content=\"Deze zelfstudie biedt een stapsgewijs voorbeeld van het uitvoeren van k-means-clustering in R.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/nl\/k-betekent-groeperen-in-r\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"K-betekent clustering in R: stapsgewijs voorbeeld - Statorials\" \/>\n<meta property=\"og:description\" content=\"Deze zelfstudie biedt een stapsgewijs voorbeeld van het uitvoeren van k-means-clustering in R.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/nl\/k-betekent-groeperen-in-r\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-27T04:03:40+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/kmmoyenne1.png\" \/>\n<meta name=\"author\" content=\"Dr.benjamin anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"Dr.benjamin anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"6\u00a0Minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/nl\/k-betekent-groeperen-in-r\/\",\"url\":\"https:\/\/statorials.org\/nl\/k-betekent-groeperen-in-r\/\",\"name\":\"K-betekent clustering in R: stapsgewijs voorbeeld - Statorials\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/nl\/#website\"},\"datePublished\":\"2023-07-27T04:03:40+00:00\",\"dateModified\":\"2023-07-27T04:03:40+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\"},\"description\":\"Deze zelfstudie biedt een stapsgewijs voorbeeld van het uitvoeren van k-means-clustering in R.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/nl\/k-betekent-groeperen-in-r\/#breadcrumb\"},\"inLanguage\":\"de\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/nl\/k-betekent-groeperen-in-r\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/nl\/k-betekent-groeperen-in-r\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Thuis\",\"item\":\"https:\/\/statorials.org\/nl\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"K-betekent clustering in r: stapsgewijs voorbeeld\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/nl\/#website\",\"url\":\"https:\/\/statorials.org\/nl\/\",\"name\":\"Statorials\",\"description\":\"Uw gids voor statistische competentie\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/nl\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"de\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\",\"name\":\"Dr.benjamin anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/\",\"url\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"caption\":\"Dr.benjamin anderson\"},\"description\":\"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder\",\"sameAs\":[\"http:\/\/statorials.org\/nl\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"K-betekent clustering in R: stapsgewijs voorbeeld - Statorials","description":"Deze zelfstudie biedt een stapsgewijs voorbeeld van het uitvoeren van k-means-clustering in R.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/nl\/k-betekent-groeperen-in-r\/","og_locale":"de_DE","og_type":"article","og_title":"K-betekent clustering in R: stapsgewijs voorbeeld - Statorials","og_description":"Deze zelfstudie biedt een stapsgewijs voorbeeld van het uitvoeren van k-means-clustering in R.","og_url":"https:\/\/statorials.org\/nl\/k-betekent-groeperen-in-r\/","og_site_name":"Statorials","article_published_time":"2023-07-27T04:03:40+00:00","og_image":[{"url":"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/kmmoyenne1.png"}],"author":"Dr.benjamin anderson","twitter_card":"summary_large_image","twitter_misc":{"Verfasst von":"Dr.benjamin anderson","Gesch\u00e4tzte Lesezeit":"6\u00a0Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/nl\/k-betekent-groeperen-in-r\/","url":"https:\/\/statorials.org\/nl\/k-betekent-groeperen-in-r\/","name":"K-betekent clustering in R: stapsgewijs voorbeeld - Statorials","isPartOf":{"@id":"https:\/\/statorials.org\/nl\/#website"},"datePublished":"2023-07-27T04:03:40+00:00","dateModified":"2023-07-27T04:03:40+00:00","author":{"@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219"},"description":"Deze zelfstudie biedt een stapsgewijs voorbeeld van het uitvoeren van k-means-clustering in R.","breadcrumb":{"@id":"https:\/\/statorials.org\/nl\/k-betekent-groeperen-in-r\/#breadcrumb"},"inLanguage":"de","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/nl\/k-betekent-groeperen-in-r\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/nl\/k-betekent-groeperen-in-r\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Thuis","item":"https:\/\/statorials.org\/nl\/"},{"@type":"ListItem","position":2,"name":"K-betekent clustering in r: stapsgewijs voorbeeld"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/nl\/#website","url":"https:\/\/statorials.org\/nl\/","name":"Statorials","description":"Uw gids voor statistische competentie","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/nl\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"de"},{"@type":"Person","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219","name":"Dr.benjamin anderson","image":{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/","url":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","contentUrl":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","caption":"Dr.benjamin anderson"},"description":"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder","sameAs":["http:\/\/statorials.org\/nl"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/1244","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/comments?post=1244"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/1244\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/media?parent=1244"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/categories?post=1244"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/tags?post=1244"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}