{"id":1243,"date":"2023-07-27T04:03:40","date_gmt":"2023-07-27T04:03:40","guid":{"rendered":"https:\/\/statorials.org\/pt\/k-significa-agrupamento-em-r\/"},"modified":"2023-07-27T04:03:40","modified_gmt":"2023-07-27T04:03:40","slug":"k-significa-agrupamento-em-r","status":"publish","type":"post","link":"https:\/\/statorials.org\/pt\/k-significa-agrupamento-em-r\/","title":{"rendered":"Clustering k-means em r: exemplo passo a passo"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\">Clustering \u00e9 uma t\u00e9cnica de aprendizado de m\u00e1quina que tenta encontrar <em>grupos<\/em> de <a href=\"https:\/\/statorials.org\/pt\/observacao-em-estatisticas\/\" target=\"_blank\" rel=\"noopener noreferrer\">observa\u00e7\u00f5es<\/a> dentro de um conjunto de dados.<\/span><\/p>\n<p> <span style=\"color: #000000;\">O objetivo \u00e9 encontrar clusters tais que as observa\u00e7\u00f5es dentro de cada cluster sejam bastante semelhantes entre si, enquanto as observa\u00e7\u00f5es em diferentes clusters sejam bastante diferentes umas das outras.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Clustering \u00e9 uma forma de <a href=\"https:\/\/statorials.org\/pt\/aprendizagem-supervisionada-vs.-aprendizagem-nao-supervisionada\/\" target=\"_blank\" rel=\"noopener noreferrer\">aprendizagem n\u00e3o supervisionada<\/a> porque estamos simplesmente tentando encontrar uma estrutura dentro de um conjunto de dados, em vez de prever o valor de uma <a href=\"https:\/\/statorials.org\/pt\/respostas-explicativas-das-variaveis\/\" target=\"_blank\" rel=\"noopener noreferrer\">vari\u00e1vel de resposta<\/a> .<\/span><\/p>\n<p> <span style=\"color: #000000;\">O clustering \u00e9 frequentemente usado em marketing quando as empresas t\u00eam acesso a informa\u00e7\u00f5es como:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Renda familiar<\/span><\/li>\n<li> <span style=\"color: #000000;\">Tamanho da fam\u00edlia<\/span><\/li>\n<li> <span style=\"color: #000000;\">Profiss\u00e3o de chefe de fam\u00edlia<\/span><\/li>\n<li> <span style=\"color: #000000;\">Dist\u00e2ncia at\u00e9 a \u00e1rea urbana mais pr\u00f3xima<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Quando esta informa\u00e7\u00e3o est\u00e1 dispon\u00edvel, o agrupamento pode ser utilizado para identificar agregados familiares que s\u00e3o semelhantes e podem ter maior probabilidade de comprar determinados produtos ou responder melhor a um determinado tipo de publicidade.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Uma das formas mais comuns de agrupamento \u00e9 conhecida como <strong>agrupamento k-means<\/strong> .<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>O que \u00e9 agrupamento K-Means?<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">O agrupamento K-means \u00e9 uma t\u00e9cnica na qual colocamos cada observa\u00e7\u00e3o de um conjunto de dados em um dos <em>K<\/em> clusters.<\/span><\/p>\n<p> <span style=\"color: #000000;\">O objetivo final \u00e9 ter <em>K<\/em> clusters nos quais as observa\u00e7\u00f5es dentro de cada cluster sejam bastante semelhantes entre si, enquanto as observa\u00e7\u00f5es em diferentes clusters sejam bastante diferentes umas das outras.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Na pr\u00e1tica, usamos as seguintes etapas para realizar o agrupamento K-means:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>1. Escolha um valor para <em>K.<\/em><\/strong><\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Primeiro, precisamos decidir quantos clusters queremos identificar nos dados. Muitas vezes precisamos simplesmente testar v\u00e1rios valores diferentes para <em>K<\/em> e analisar os resultados para ver qual n\u00famero de clusters parece fazer mais sentido para um determinado problema.<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\"><strong>2. Atribua aleatoriamente cada observa\u00e7\u00e3o a um cluster inicial, de 1 a <em>K.<\/em><\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>3. Execute o procedimento a seguir at\u00e9 que as atribui\u00e7\u00f5es do cluster parem de mudar.<\/strong><\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Para cada um dos <em>K<\/em> clusters, calcule o <em>centro de gravidade do cluster.<\/em> Este \u00e9 simplesmente o vetor de caracter\u00edsticas <em>p-<\/em> m\u00e9dias para as observa\u00e7\u00f5es do <em>k-\u00e9simo<\/em> cluster.<\/span><\/li>\n<li> <span style=\"color: #000000;\">Atribua cada observa\u00e7\u00e3o ao cluster com o centr\u00f3ide mais pr\u00f3ximo. Aqui, <em>o mais pr\u00f3ximo<\/em> \u00e9 definido usando <a href=\"https:\/\/en.wikipedia.org\/wiki\/Euclidean_distance#Squared_Euclidean_distance\" target=\"_blank\" rel=\"noopener noreferrer\">a dist\u00e2ncia euclidiana<\/a> .<\/span><\/li>\n<\/ul>\n<h3> <span style=\"color: #000000;\"><strong>Clustering K-Means em R<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">O tutorial a seguir fornece um exemplo passo a passo de como realizar clustering k-means em R.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Passo 1: Carregue os pacotes necess\u00e1rios<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Primeiro, carregaremos dois pacotes contendo v\u00e1rias fun\u00e7\u00f5es \u00fateis para clustering k-means em R.<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #993300;\">library<\/span> (factoextra)\n<span style=\"color: #993300;\">library<\/span> (cluster)<\/strong><\/pre>\n<h3> <span style=\"color: #000000;\"><strong>Etapa 2: carregar e preparar dados<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Para este exemplo, usaremos o conjunto de dados <em>USArrests<\/em> incorporado em R, que cont\u00e9m o n\u00famero de pris\u00f5es por 100.000 pessoas em cada estado dos EUA em 1973 por <em>assassinato<\/em> , <em>agress\u00e3o<\/em> e <em>estupro<\/em> , bem como a porcentagem da popula\u00e7\u00e3o de cada estado vivendo em \u00e1reas urbanas. \u00e1reas. , <em>UrbanPop<\/em> .<\/span><\/p>\n<p> <span style=\"color: #000000;\">O c\u00f3digo a seguir mostra como fazer o seguinte:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Carregar conjunto de dados <em>USArrests<\/em><\/span><\/li>\n<li> <span style=\"color: #000000;\">Remova todas as linhas com valores ausentes<\/span><\/li>\n<li> <span style=\"color: #000000;\">Dimensione cada vari\u00e1vel no conjunto de dados para ter uma m\u00e9dia de 0 e um desvio padr\u00e3o de 1<\/span><\/li>\n<\/ul>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#load data<\/span>\ndf &lt;-USArrests\n\n<span style=\"color: #008080;\">#remove rows with missing values<\/span><\/strong>\n<strong>df &lt;- na. <span style=\"color: #3366ff;\">omitted<\/span> (df)\n\n<span style=\"color: #008080;\">#scale each variable to have a mean of 0 and sd of 1<\/span><\/strong>\n<strong>df &lt;- scale(df)\n\n<span style=\"color: #008080;\">#view first six rows of dataset<\/span>\nhead(df)\n\n               Murder Assault UrbanPop Rape\nAlabama 1.24256408 0.7828393 -0.5209066 -0.003416473\nAlaska 0.50786248 1.1068225 -1.2117642 2.484202941\nArizona 0.07163341 1.4788032 0.9989801 1.042878388\nArkansas 0.23234938 0.2308680 -1.0735927 -0.184916602\nCalifornia 0.27826823 1.2628144 1.7589234 2.067820292\nColorado 0.02571456 0.3988593 0.8608085 1.864967207\n<\/strong><\/pre>\n<h3> <span style=\"color: #000000;\"><strong>Etapa 3: Encontre o n\u00famero ideal de clusters<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Para realizar o agrupamento k-means em R, podemos usar a fun\u00e7\u00e3o integrada <strong>kmeans()<\/strong> , que usa a seguinte sintaxe:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>kmeans (dados, centros, nstart)<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Ouro:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\"><strong>dados:<\/strong> nome do conjunto de dados.<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>centros:<\/strong> O n\u00famero de clusters, denotados <em>k<\/em> .<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>nstart:<\/strong> o n\u00famero de configura\u00e7\u00f5es iniciais. Como \u00e9 poss\u00edvel que diferentes clusters iniciais levem a resultados diferentes, recomenda-se usar diversas configura\u00e7\u00f5es iniciais diferentes. O algoritmo k-means encontrar\u00e1 as configura\u00e7\u00f5es iniciais que levam \u00e0 menor varia\u00e7\u00e3o dentro do cluster.<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Como n\u00e3o sabemos antecipadamente quantos clusters s\u00e3o ideais, criaremos dois gr\u00e1ficos diferentes que podem nos ajudar a decidir:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>1. N\u00famero de clusters em rela\u00e7\u00e3o ao total na soma dos quadrados<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Primeiro, usaremos a fun\u00e7\u00e3o <strong>fviz_nbclust()<\/strong> para criar um gr\u00e1fico do n\u00famero de clusters versus o total na soma dos quadrados:<\/span> <\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong>fviz_nbclust(df, kmeans, method = \u201c <span style=\"color: #008000;\">wss<\/span> \u201d)<\/strong> <\/pre>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-12310 \" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/kmmoyenne1.png\" alt=\"N\u00famero ideal de clusters em cluster k-means\" width=\"444\" height=\"434\" srcset=\"\" sizes=\"auto, \"><\/p>\n<p> <span style=\"color: #000000;\">Normalmente, quando criamos esse tipo de gr\u00e1fico, procuramos um \u201cjoelho\u201d onde a soma dos quadrados come\u00e7a a \u201cdobrar\u201d ou se nivelar. Geralmente, esse \u00e9 o n\u00famero ideal de clusters.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Para este gr\u00e1fico, parece que h\u00e1 uma pequena tor\u00e7\u00e3o ou \u201ccurvatura\u201d em k = 4 clusters.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>2. N\u00famero de clusters versus estat\u00edsticas de lacunas<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Outra forma de determinar o n\u00famero ideal de clusters \u00e9 usar uma m\u00e9trica chamada <a style=\"color: #000000;\" href=\"https:\/\/web.stanford.edu\/~hastie\/Papers\/gap.pdf\" target=\"_blank\" rel=\"noopener noreferrer\">estat\u00edstica de desvio<\/a> , que compara a varia\u00e7\u00e3o total intra-cluster para diferentes valores de k com seus valores esperados para uma distribui\u00e7\u00e3o sem cluster.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Podemos calcular a estat\u00edstica de lacuna para cada n\u00famero de clusters usando a fun\u00e7\u00e3o <strong>clusGap()<\/strong> do pacote <em>de cluster<\/em> , bem como representar graficamente os clusters em rela\u00e7\u00e3o \u00e0s estat\u00edsticas de lacuna usando a fun\u00e7\u00e3o <strong>fviz_gap_stat()<\/strong> :<\/span> <\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#calculate gap statistic based on number of clusters\n<\/span>gap_stat &lt;- clusGap(df,\n                    FUN = kmeans,\n                    nstart = 25,\n                    K.max = 10,\n                    B = 50)\n\n<span style=\"color: #008080;\">#plot number of clusters vs. gap statistic\n<\/span>fviz_gap_stat(gap_stat)<\/strong> <\/pre>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-12311 \" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/moyenne-km2.png\" alt=\"Estat\u00edstica de desvio para n\u00famero ideal de clusters\" width=\"454\" height=\"445\" srcset=\"\" sizes=\"auto, \"><\/p>\n<p> <span style=\"color: #000000;\">No gr\u00e1fico, podemos ver que a estat\u00edstica de gap \u00e9 mais alta em k = 4 clusters, o que corresponde ao m\u00e9todo do cotovelo que usamos anteriormente.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Etapa 4: realizar clustering K-Means com <em>K<\/em> ideal<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Finalmente, podemos realizar agrupamento k-means no conjunto de dados usando o valor ideal para <em>k<\/em> de 4:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#make this example reproducible\n<span style=\"color: #000000;\">set.seed(1)<\/span>\n\n#perform k-means clustering with k = 4 clusters\n<\/span>km &lt;- kmeans(df, centers = 4, nstart = 25)\n\n<span style=\"color: #008080;\">#view results\n<\/span>km\n\nK-means clustering with 4 clusters of sizes 16, 13, 13, 8\n\nCluster means:\n      Murder Assault UrbanPop Rape\n1 -0.4894375 -0.3826001 0.5758298 -0.26165379\n2 -0.9615407 -1.1066010 -0.9301069 -0.96676331\n3 0.6950701 1.0394414 0.7226370 1.27693964\n4 1.4118898 0.8743346 -0.8145211 0.01927104\n\nVector clustering:\n       Alabama Alaska Arizona Arkansas California Colorado \n             4 3 3 4 3 3 \n   Connecticut Delaware Florida Georgia Hawaii Idaho \n             1 1 3 4 1 2 \n      Illinois Indiana Iowa Kansas Kentucky Louisiana \n             3 1 2 1 2 4 \n         Maine Maryland Massachusetts Michigan Minnesota Mississippi \n             2 3 1 3 2 4 \n      Missouri Montana Nebraska Nevada New Hampshire New Jersey \n             3 2 2 3 2 1 \n    New Mexico New York North Carolina North Dakota Ohio Oklahoma \n             3 3 4 2 1 1 \n        Oregon Pennsylvania Rhode Island South Carolina South Dakota Tennessee \n             1 1 1 4 2 4 \n         Texas Utah Vermont Virginia Washington West Virginia \n             3 1 2 1 1 2 \n     Wisconsin Wyoming \n             2 1 \n\nWithin cluster sum of squares by cluster:\n[1] 16.212213 11.952463 19.922437 8.316061\n (between_SS \/ total_SS = 71.2%)\n\nAvailable components:\n\n[1] \"cluster\" \"centers\" \"totss\" \"withinss\" \"tot.withinss\" \"betweenss\"   \n[7] \"size\" \"iter\" \"ifault\"         \n<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Pelos resultados podemos ver que:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\"><b>16<\/b> estados foram atribu\u00eddos ao primeiro cluster<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>13<\/strong> estados foram atribu\u00eddos ao segundo cluster<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>13<\/strong> estados foram atribu\u00eddos ao terceiro cluster<\/span><\/li>\n<li> <span style=\"color: #000000;\"><b>8<\/b> estados foram atribu\u00eddos ao quarto cluster<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Podemos visualizar os clusters em um gr\u00e1fico de dispers\u00e3o que exibe os dois primeiros componentes principais nos eixos usando a fun\u00e7\u00e3o <strong>fivz_cluster()<\/strong> :<\/span> <\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#plot results of final k-means model\n<span style=\"color: #000000;\">fviz_cluster(km, data = df)\n<\/span><\/span><\/strong><\/pre>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-12313 \" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/kmmoyenne4.png\" alt=\"Gr\u00e1fico de agrupamento K-m\u00e9dias em R\" width=\"475\" height=\"472\" srcset=\"\" sizes=\"auto, \"><\/p>\n<p> <span style=\"color: #000000;\">Tamb\u00e9m podemos usar a fun\u00e7\u00e3o <strong>Aggregate()<\/strong> para encontrar a m\u00e9dia das vari\u00e1veis em cada cluster:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#find means of each cluster\n<span style=\"color: #000000;\">aggregate(USArrests, by= <span style=\"color: #3366ff;\">list<\/span> (cluster=km$cluster), mean)\n\ncluster Murder Assault UrbanPop Rape\n\t\t\t\t\n1 3.60000 78.53846 52.07692 12.17692\n2 10.81538 257.38462 76.00000 33.19231\n3 5.65625 138.87500 73.87500 18.78125\n4 13.93750 243.62500 53.75000 21.41250\n<\/span><\/span><\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Interpretamos esta sa\u00edda da seguinte forma:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">O n\u00famero m\u00e9dio de assassinatos por 100.000 cidad\u00e3os entre os estados do Grupo 1 \u00e9 de <strong>3,6<\/strong> .<\/span><\/li>\n<li> <span style=\"color: #000000;\">O n\u00famero m\u00e9dio de agress\u00f5es por 100.000 cidad\u00e3os entre os estados do Grupo 1 \u00e9 de <strong>78,5<\/strong> .<\/span><\/li>\n<li> <span style=\"color: #000000;\">A porcentagem m\u00e9dia de residentes que vivem em \u00e1rea urbana entre os estados do Grupo 1 \u00e9 de <b>52,1%<\/b> .<\/span><\/li>\n<li> <span style=\"color: #000000;\">O n\u00famero m\u00e9dio de viola\u00e7\u00f5es por 100.000 cidad\u00e3os entre os estados do Grupo 1 \u00e9 de <strong>12,2<\/strong> <strong>.<\/strong><\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">E assim por diante.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Tamb\u00e9m podemos adicionar as atribui\u00e7\u00f5es de cluster de cada estado ao conjunto de dados original:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#add cluster assignment to original data\n<span style=\"color: #000000;\">final_data &lt;- cbind(USArrests, cluster = km$cluster)\n<\/span>\n#view final data\n<span style=\"color: #000000;\">head(final_data)\n\n\t<\/span><span style=\"color: #000000;\">Murder Assault UrbanPop<\/span> <span style=\"color: #000000;\">Rape<\/span> <span style=\"color: #000000;\">cluster\n\t\t\t\t\nAlabama<\/span> <span style=\"color: #000000;\">13.2<\/span> <span style=\"color: #000000;\">236 58<\/span> <span style=\"color: #000000;\">21.2<\/span> <span style=\"color: #000000;\">4\nAlaska<\/span> <span style=\"color: #000000;\">10.0 263 48<\/span> <span style=\"color: #000000;\">44.5<\/span> <span style=\"color: #000000;\">2\nArizona<\/span> <span style=\"color: #000000;\">8.1 294 80<\/span> <span style=\"color: #000000;\">31.0<\/span> <span style=\"color: #000000;\">2\nArkansas<\/span> <span style=\"color: #000000;\">8.8 190 50<\/span> <span style=\"color: #000000;\">19.5<\/span> <span style=\"color: #000000;\">4\nCalifornia<\/span> <span style=\"color: #000000;\">9.0 276 91<\/span> <span style=\"color: #000000;\">40.6<\/span> <span style=\"color: #000000;\">2\nColorado<\/span> <span style=\"color: #000000;\">7.9 204 78<\/span> <span style=\"color: #000000;\">38.7<\/span> <span style=\"color: #000000;\">2\n<\/span><\/span><\/strong><\/pre>\n<h3> <span style=\"color: #000000;\"><strong>Vantagens e desvantagens do agrupamento K-Means<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">O clustering K-means oferece as seguintes vantagens:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">\u00c9 um algoritmo r\u00e1pido.<\/span><\/li>\n<li> <span style=\"color: #000000;\">Ele pode lidar bem com grandes conjuntos de dados.<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">No entanto, tem as seguintes desvantagens potenciais:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Isso exige que especifiquemos o n\u00famero de clusters antes de executar o algoritmo.<\/span><\/li>\n<li> <span style=\"color: #000000;\">\u00c9 sens\u00edvel a valores discrepantes.<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Duas alternativas para o agrupamento k-means s\u00e3o <a href=\"https:\/\/statorials.org\/pt\/k-medoides-em-r\/\" target=\"_blank\" rel=\"noopener noreferrer\">o agrupamento k-means<\/a> e o agrupamento hier\u00e1rquico.<\/span><\/p>\n<hr>\n<p> <span style=\"color: #000000;\">Voc\u00ea pode encontrar o c\u00f3digo R completo usado neste exemplo <a href=\"https:\/\/github.com\/Statorials\/R-Guides\/blob\/main\/k_means.R\" target=\"_blank\" rel=\"noopener noreferrer\">aqui<\/a> .<\/span><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Clustering \u00e9 uma t\u00e9cnica de aprendizado de m\u00e1quina que tenta encontrar grupos de observa\u00e7\u00f5es dentro de um conjunto de dados. O objetivo \u00e9 encontrar clusters tais que as observa\u00e7\u00f5es dentro de cada cluster sejam bastante semelhantes entre si, enquanto as observa\u00e7\u00f5es em diferentes clusters sejam bastante diferentes umas das outras. Clustering \u00e9 uma forma de [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"class_list":["post-1243","post","type-post","status-publish","format-standard","hentry","category-guia"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Clustering K-Means em R: Exemplo passo a passo - Estatologia<\/title>\n<meta name=\"description\" content=\"Este tutorial fornece um exemplo passo a passo de como realizar clustering k-means em R.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/pt\/k-significa-agrupamento-em-r\/\" \/>\n<meta property=\"og:locale\" content=\"pt_PT\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Clustering K-Means em R: Exemplo passo a passo - Estatologia\" \/>\n<meta property=\"og:description\" content=\"Este tutorial fornece um exemplo passo a passo de como realizar clustering k-means em R.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/pt\/k-significa-agrupamento-em-r\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-27T04:03:40+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/kmmoyenne1.png\" \/>\n<meta name=\"author\" content=\"Dr. benjamim anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Escrito por\" \/>\n\t<meta name=\"twitter:data1\" content=\"Dr. benjamim anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Tempo estimado de leitura\" \/>\n\t<meta name=\"twitter:data2\" content=\"7 minutos\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/pt\/k-significa-agrupamento-em-r\/\",\"url\":\"https:\/\/statorials.org\/pt\/k-significa-agrupamento-em-r\/\",\"name\":\"Clustering K-Means em R: Exemplo passo a passo - Estatologia\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/pt\/#website\"},\"datePublished\":\"2023-07-27T04:03:40+00:00\",\"dateModified\":\"2023-07-27T04:03:40+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/pt\/#\/schema\/person\/e08f98e8db95e0aa9c310e1b27c9c666\"},\"description\":\"Este tutorial fornece um exemplo passo a passo de como realizar clustering k-means em R.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/pt\/k-significa-agrupamento-em-r\/#breadcrumb\"},\"inLanguage\":\"pt-PT\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/pt\/k-significa-agrupamento-em-r\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/pt\/k-significa-agrupamento-em-r\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Lar\",\"item\":\"https:\/\/statorials.org\/pt\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Clustering k-means em r: exemplo passo a passo\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/pt\/#website\",\"url\":\"https:\/\/statorials.org\/pt\/\",\"name\":\"Statorials\",\"description\":\"O seu guia para a literacia estat\u00edstica!\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/pt\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"pt-PT\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/pt\/#\/schema\/person\/e08f98e8db95e0aa9c310e1b27c9c666\",\"name\":\"Dr. benjamim anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"pt-PT\",\"@id\":\"https:\/\/statorials.org\/pt\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/statorials.org\/pt\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"https:\/\/statorials.org\/pt\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"caption\":\"Dr. benjamim anderson\"},\"description\":\"Ol\u00e1, sou Benjamin, um professor aposentado de estat\u00edstica que se tornou professor dedicado na Statorials. Com vasta experi\u00eancia e conhecimento na \u00e1rea de estat\u00edstica, estou empenhado em compartilhar meu conhecimento para capacitar os alunos por meio de Statorials. Saber mais\",\"sameAs\":[\"https:\/\/statorials.org\/pt\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Clustering K-Means em R: Exemplo passo a passo - Estatologia","description":"Este tutorial fornece um exemplo passo a passo de como realizar clustering k-means em R.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/pt\/k-significa-agrupamento-em-r\/","og_locale":"pt_PT","og_type":"article","og_title":"Clustering K-Means em R: Exemplo passo a passo - Estatologia","og_description":"Este tutorial fornece um exemplo passo a passo de como realizar clustering k-means em R.","og_url":"https:\/\/statorials.org\/pt\/k-significa-agrupamento-em-r\/","og_site_name":"Statorials","article_published_time":"2023-07-27T04:03:40+00:00","og_image":[{"url":"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/kmmoyenne1.png"}],"author":"Dr. benjamim anderson","twitter_card":"summary_large_image","twitter_misc":{"Escrito por":"Dr. benjamim anderson","Tempo estimado de leitura":"7 minutos"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/pt\/k-significa-agrupamento-em-r\/","url":"https:\/\/statorials.org\/pt\/k-significa-agrupamento-em-r\/","name":"Clustering K-Means em R: Exemplo passo a passo - Estatologia","isPartOf":{"@id":"https:\/\/statorials.org\/pt\/#website"},"datePublished":"2023-07-27T04:03:40+00:00","dateModified":"2023-07-27T04:03:40+00:00","author":{"@id":"https:\/\/statorials.org\/pt\/#\/schema\/person\/e08f98e8db95e0aa9c310e1b27c9c666"},"description":"Este tutorial fornece um exemplo passo a passo de como realizar clustering k-means em R.","breadcrumb":{"@id":"https:\/\/statorials.org\/pt\/k-significa-agrupamento-em-r\/#breadcrumb"},"inLanguage":"pt-PT","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/pt\/k-significa-agrupamento-em-r\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/pt\/k-significa-agrupamento-em-r\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Lar","item":"https:\/\/statorials.org\/pt\/"},{"@type":"ListItem","position":2,"name":"Clustering k-means em r: exemplo passo a passo"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/pt\/#website","url":"https:\/\/statorials.org\/pt\/","name":"Statorials","description":"O seu guia para a literacia estat\u00edstica!","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/pt\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"pt-PT"},{"@type":"Person","@id":"https:\/\/statorials.org\/pt\/#\/schema\/person\/e08f98e8db95e0aa9c310e1b27c9c666","name":"Dr. benjamim anderson","image":{"@type":"ImageObject","inLanguage":"pt-PT","@id":"https:\/\/statorials.org\/pt\/#\/schema\/person\/image\/","url":"https:\/\/statorials.org\/pt\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","contentUrl":"https:\/\/statorials.org\/pt\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","caption":"Dr. benjamim anderson"},"description":"Ol\u00e1, sou Benjamin, um professor aposentado de estat\u00edstica que se tornou professor dedicado na Statorials. Com vasta experi\u00eancia e conhecimento na \u00e1rea de estat\u00edstica, estou empenhado em compartilhar meu conhecimento para capacitar os alunos por meio de Statorials. Saber mais","sameAs":["https:\/\/statorials.org\/pt"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/pt\/wp-json\/wp\/v2\/posts\/1243","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/statorials.org\/pt\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/pt\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/pt\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/pt\/wp-json\/wp\/v2\/comments?post=1243"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/pt\/wp-json\/wp\/v2\/posts\/1243\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/pt\/wp-json\/wp\/v2\/media?parent=1243"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/pt\/wp-json\/wp\/v2\/categories?post=1243"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/pt\/wp-json\/wp\/v2\/tags?post=1243"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}