{"id":1242,"date":"2023-07-27T04:03:40","date_gmt":"2023-07-27T04:03:40","guid":{"rendered":"https:\/\/statorials.org\/pl\/k-oznacza-grupowanie-w-r\/"},"modified":"2023-07-27T04:03:40","modified_gmt":"2023-07-27T04:03:40","slug":"k-oznacza-grupowanie-w-r","status":"publish","type":"post","link":"https:\/\/statorials.org\/pl\/k-oznacza-grupowanie-w-r\/","title":{"rendered":"Grupowanie k-\u015brednich w r: przyk\u0142ad krok po kroku"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\">Grupowanie to technika uczenia maszynowego, kt\u00f3ra pr\u00f3buje znale\u017a\u0107 <em>grupy<\/em> <a href=\"https:\/\/statorials.org\/pl\/obserwacja-w-statystyce\/\" target=\"_blank\" rel=\"noopener noreferrer\">obserwacji<\/a> w zbiorze danych.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Celem jest znalezienie takich skupie\u0144, w kt\u00f3rych obserwacje w ka\u017cdym klastrze b\u0119d\u0105 do siebie do\u015b\u0107 podobne, podczas gdy obserwacje w r\u00f3\u017cnych skupieniach znacznie si\u0119 od siebie r\u00f3\u017cni\u0105.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Klastrowanie jest form\u0105 <a href=\"https:\/\/statorials.org\/pl\/uczenie-sie-nadzorowane-a-uczenie-sie-bez-nadzoru\/\" target=\"_blank\" rel=\"noopener noreferrer\">uczenia si\u0119 bez nadzoru<\/a> , poniewa\u017c po prostu staramy si\u0119 znale\u017a\u0107 struktur\u0119 w zbiorze danych, zamiast przewidywa\u0107 warto\u015b\u0107 <a href=\"https:\/\/statorials.org\/pl\/zmienne-odpowiedzi-wyjasniajace\/\" target=\"_blank\" rel=\"noopener noreferrer\">zmiennej odpowiedzi<\/a> .<\/span><\/p>\n<p> <span style=\"color: #000000;\">Klastrowanie jest cz\u0119sto stosowane w marketingu, gdy firmy maj\u0105 dost\u0119p do informacji takich jak:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Przych\u00f3d domowy<\/span><\/li>\n<li> <span style=\"color: #000000;\">Wielko\u015b\u0107 gospodarstwa domowego<\/span><\/li>\n<li> <span style=\"color: #000000;\">Zaw\u00f3d g\u0142owy gospodarstwa domowego<\/span><\/li>\n<li> <span style=\"color: #000000;\">Odleg\u0142o\u015b\u0107 do najbli\u017cszego obszaru miejskiego<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Je\u017celi takie informacje s\u0105 dost\u0119pne, mo\u017cna zastosowa\u0107 grupowanie w celu zidentyfikowania gospodarstw domowych, kt\u00f3re s\u0105 podobne i kt\u00f3re mog\u0105 z wi\u0119kszym prawdopodobie\u0144stwem zakupi\u0107 okre\u015blone produkty lub lepiej reagowa\u0107 na okre\u015blony rodzaj reklamy.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Jedn\u0105 z najpowszechniejszych form grupowania jest <strong>grupowanie k-\u015brednich<\/strong> .<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Co to jest grupowanie K-\u015brednich?<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Grupowanie K-\u015brednich to technika, w kt\u00f3rej ka\u017cd\u0105 obserwacj\u0119 ze zbioru danych umieszczamy w jednym z <em>K<\/em> klastr\u00f3w.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Ostatecznym celem jest utworzenie <em>K<\/em> klastr\u00f3w, w kt\u00f3rych obserwacje w ka\u017cdym klastrze s\u0105 do siebie do\u015b\u0107 podobne, podczas gdy obserwacje w r\u00f3\u017cnych klastrach znacznie si\u0119 od siebie r\u00f3\u017cni\u0105.<\/span><\/p>\n<p> <span style=\"color: #000000;\">W praktyce do przeprowadzenia grupowania K-\u015brednich stosujemy nast\u0119puj\u0105ce kroki:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>1. Wybierz warto\u015b\u0107 <em>K.<\/em><\/strong><\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Najpierw musimy zdecydowa\u0107, ile skupie\u0144 chcemy zidentyfikowa\u0107 w danych. Cz\u0119sto wystarczy po prostu przetestowa\u0107 kilka r\u00f3\u017cnych warto\u015bci <em>K<\/em> i przeanalizowa\u0107 wyniki, aby zobaczy\u0107, kt\u00f3ra liczba skupie\u0144 wydaje si\u0119 mie\u0107 najwi\u0119kszy sens dla danego problemu.<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\"><strong>2. Losowo przypisz ka\u017cd\u0105 obserwacj\u0119 do skupienia pocz\u0105tkowego, od 1 do <em>K.<\/em><\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>3. Wykonuj poni\u017csz\u0105 procedur\u0119, a\u017c przypisania klastr\u00f3w przestan\u0105 si\u0119 zmienia\u0107.<\/strong><\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Dla ka\u017cdej z gromad <em>K<\/em> oblicz <em>\u015brodek ci\u0119\u017cko\u015bci gromady.<\/em> Jest to po prostu wektor <em>p-<\/em> \u015brednich cech obserwacji <em>k-tego<\/em> klastra.<\/span><\/li>\n<li> <span style=\"color: #000000;\">Przypisz ka\u017cd\u0105 obserwacj\u0119 do klastra o najbli\u017cszym centroidzie. Tutaj <em>najbli\u017cej<\/em> definiuje si\u0119 <a href=\"https:\/\/en.wikipedia.org\/wiki\/Euclidean_distance#Squared_Euclidean_distance\" target=\"_blank\" rel=\"noopener noreferrer\">odleg\u0142o\u015b\u0107 euklidesow\u0105<\/a> .<\/span><\/li>\n<\/ul>\n<h3> <span style=\"color: #000000;\"><strong>Grupowanie K-\u015brednich w R<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Poni\u017cszy samouczek zawiera przyk\u0142ad krok po kroku wykonywania grupowania k-\u015brednich w j\u0119zyku R.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Krok 1: Za\u0142aduj niezb\u0119dne pakiety<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Najpierw za\u0142adujemy dwa pakiety zawieraj\u0105ce kilka przydatnych funkcji do grupowania k-\u015brednich w R.<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #993300;\">library<\/span> (factoextra)\n<span style=\"color: #993300;\">library<\/span> (cluster)<\/strong><\/pre>\n<h3> <span style=\"color: #000000;\"><strong>Krok 2: Za\u0142aduj i przygotuj dane<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">W tym przyk\u0142adzie u\u017cyjemy zbioru danych <em>USArrests<\/em> wbudowanego w R, kt\u00f3ry zawiera liczb\u0119 aresztowa\u0144 na 100 000 mieszka\u0144c\u00f3w w ka\u017cdym stanie USA w 1973 r. za <em>morderstwo<\/em> , <em>napa\u015b\u0107<\/em> i <em>gwa\u0142t<\/em> , a tak\u017ce procent populacji ka\u017cdego stanu mieszkaj\u0105cej w obszarach miejskich obszary. , <em>UrbanPop<\/em> .<\/span><\/p>\n<p> <span style=\"color: #000000;\">Poni\u017cszy kod pokazuje, jak wykona\u0107 nast\u0119puj\u0105ce czynno\u015bci:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Za\u0142aduj zbi\u00f3r danych <em>USArrests<\/em><\/span><\/li>\n<li> <span style=\"color: #000000;\">Usu\u0144 wszystkie wiersze z brakuj\u0105cymi warto\u015bciami<\/span><\/li>\n<li> <span style=\"color: #000000;\">Skaluj ka\u017cd\u0105 zmienn\u0105 w zbiorze danych tak, aby mia\u0142a \u015bredni\u0105 0 i odchylenie standardowe 1<\/span><\/li>\n<\/ul>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#load data<\/span>\ndf &lt;-USArrests\n\n<span style=\"color: #008080;\">#remove rows with missing values<\/span><\/strong>\n<strong>df &lt;- na. <span style=\"color: #3366ff;\">omitted<\/span> (df)\n\n<span style=\"color: #008080;\">#scale each variable to have a mean of 0 and sd of 1<\/span><\/strong>\n<strong>df &lt;- scale(df)\n\n<span style=\"color: #008080;\">#view first six rows of dataset<\/span>\nhead(df)\n\n               Murder Assault UrbanPop Rape\nAlabama 1.24256408 0.7828393 -0.5209066 -0.003416473\nAlaska 0.50786248 1.1068225 -1.2117642 2.484202941\nArizona 0.07163341 1.4788032 0.9989801 1.042878388\nArkansas 0.23234938 0.2308680 -1.0735927 -0.184916602\nCalifornia 0.27826823 1.2628144 1.7589234 2.067820292\nColorado 0.02571456 0.3988593 0.8608085 1.864967207\n<\/strong><\/pre>\n<h3> <span style=\"color: #000000;\"><strong>Krok 3: Znajd\u017a optymaln\u0105 liczb\u0119 klastr\u00f3w<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Aby wykona\u0107 grupowanie k-\u015brednich w R, mo\u017cemy skorzysta\u0107 z wbudowanej funkcji <strong>kmeans()<\/strong> , kt\u00f3ra wykorzystuje nast\u0119puj\u0105c\u0105 sk\u0142adni\u0119:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>kmeans (dane, centra, nstart)<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Z\u0142oto:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\"><strong>dane:<\/strong> nazwa zbioru danych.<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>centra:<\/strong> liczba skupie\u0144, oznaczona <em>k<\/em> .<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>nstart:<\/strong> liczba konfiguracji pocz\u0105tkowych. Poniewa\u017c mo\u017cliwe jest, \u017ce r\u00f3\u017cne pocz\u0105tkowe klastry pocz\u0105tkowe b\u0119d\u0105 prowadzi\u0107 do r\u00f3\u017cnych wynik\u00f3w, zaleca si\u0119 stosowanie kilku r\u00f3\u017cnych konfiguracji pocz\u0105tkowych. Algorytm k-\u015brednich znajdzie pocz\u0105tkowe konfiguracje, kt\u00f3re prowadz\u0105 do najmniejszej zmienno\u015bci w klastrze.<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Poniewa\u017c nie wiemy z g\u00f3ry, ile skupie\u0144 jest optymalnych, utworzymy dwa r\u00f3\u017cne wykresy, kt\u00f3re pomog\u0105 nam podj\u0105\u0107 decyzj\u0119:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>1. Liczba skupie\u0144 w stosunku do sumy kwadrat\u00f3w<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Najpierw u\u017cyjemy funkcji <strong>fviz_nbclust()<\/strong> , aby utworzy\u0107 wykres liczby skupie\u0144 w funkcji sumy kwadrat\u00f3w:<\/span> <\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong>fviz_nbclust(df, kmeans, method = \u201c <span style=\"color: #008000;\">wss<\/span> \u201d)<\/strong> <\/pre>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-12310 \" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/kmmoyenne1.png\" alt=\"Optymalna liczba skupie\u0144 w skupieniu k-\u015brednich\" width=\"444\" height=\"434\" srcset=\"\" sizes=\"auto, \"><\/p>\n<p> <span style=\"color: #000000;\">Zazwyczaj, tworz\u0105c tego typu wykres, szukamy \u201ekolana\u201d, w kt\u00f3rym suma kwadrat\u00f3w zaczyna si\u0119 \u201ezagina\u0107\u201d lub wyr\u00f3wnywa\u0107. Jest to na og\u00f3\u0142 optymalna liczba klastr\u00f3w.<\/span><\/p>\n<p> <span style=\"color: #000000;\">W przypadku tego wykresu wydaje si\u0119, \u017ce przy k = 4 skupiskach wyst\u0119puje niewielkie za\u0142amanie lub \u201ezagi\u0119cie\u201d.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>2. Liczba klastr\u00f3w a statystyki luk<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Innym sposobem okre\u015blenia optymalnej liczby skupie\u0144 jest u\u017cycie metryki zwanej <a style=\"color: #000000;\" href=\"https:\/\/web.stanford.edu\/~hastie\/Papers\/gap.pdf\" target=\"_blank\" rel=\"noopener noreferrer\">statystyk\u0105 odchyle\u0144<\/a> , kt\u00f3ra por\u00f3wnuje ca\u0142kowit\u0105 zmienno\u015b\u0107 wewn\u0105trz skupie\u0144 dla r\u00f3\u017cnych warto\u015bci k z ich warto\u015bciami oczekiwanymi dla rozk\u0142adu bez grupowania.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Mo\u017cemy obliczy\u0107 statystyk\u0119 luk dla ka\u017cdej liczby klastr\u00f3w za pomoc\u0105 funkcji <strong>clusGap()<\/strong> z pakietu <em>klastr\u00f3w<\/em> , a tak\u017ce wykre\u015bli\u0107 klastry wzgl\u0119dem statystyk luk za pomoc\u0105 funkcji <strong>fviz_gap_stat()<\/strong> :<\/span> <\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#calculate gap statistic based on number of clusters\n<\/span>gap_stat &lt;- clusGap(df,\n                    FUN = kmeans,\n                    nstart = 25,\n                    K.max = 10,\n                    B = 50)\n\n<span style=\"color: #008080;\">#plot number of clusters vs. gap statistic\n<\/span>fviz_gap_stat(gap_stat)<\/strong> <\/pre>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-12311 \" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/moyenne-km2.png\" alt=\"Statystyka odchyle\u0144 dla optymalnej liczby skupie\u0144\" width=\"454\" height=\"445\" srcset=\"\" sizes=\"auto, \"><\/p>\n<p> <span style=\"color: #000000;\">Z wykresu wida\u0107, \u017ce statystyka luki jest najwy\u017csza przy k = 4 skupie\u0144, co odpowiada zastosowanej wcze\u015bniej metodzie \u0142okcia.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Krok 4: Wykonaj grupowanie K-\u015brednich z optymalnym <em>K<\/em><\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Na koniec mo\u017cemy przeprowadzi\u0107 grupowanie k-\u015brednich na zbiorze danych, u\u017cywaj\u0105c optymalnej warto\u015bci <em>k<\/em> z 4:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#make this example reproducible\n<span style=\"color: #000000;\">set.seed(1)<\/span>\n\n#perform k-means clustering with k = 4 clusters\n<\/span>km &lt;- kmeans(df, centers = 4, nstart = 25)\n\n<span style=\"color: #008080;\">#view results\n<\/span>km\n\nK-means clustering with 4 clusters of sizes 16, 13, 13, 8\n\nCluster means:\n      Murder Assault UrbanPop Rape\n1 -0.4894375 -0.3826001 0.5758298 -0.26165379\n2 -0.9615407 -1.1066010 -0.9301069 -0.96676331\n3 0.6950701 1.0394414 0.7226370 1.27693964\n4 1.4118898 0.8743346 -0.8145211 0.01927104\n\nVector clustering:\n       Alabama Alaska Arizona Arkansas California Colorado \n             4 3 3 4 3 3 \n   Connecticut Delaware Florida Georgia Hawaii Idaho \n             1 1 3 4 1 2 \n      Illinois Indiana Iowa Kansas Kentucky Louisiana \n             3 1 2 1 2 4 \n         Maine Maryland Massachusetts Michigan Minnesota Mississippi \n             2 3 1 3 2 4 \n      Missouri Montana Nebraska Nevada New Hampshire New Jersey \n             3 2 2 3 2 1 \n    New Mexico New York North Carolina North Dakota Ohio Oklahoma \n             3 3 4 2 1 1 \n        Oregon Pennsylvania Rhode Island South Carolina South Dakota Tennessee \n             1 1 1 4 2 4 \n         Texas Utah Vermont Virginia Washington West Virginia \n             3 1 2 1 1 2 \n     Wisconsin Wyoming \n             2 1 \n\nWithin cluster sum of squares by cluster:\n[1] 16.212213 11.952463 19.922437 8.316061\n (between_SS \/ total_SS = 71.2%)\n\nAvailable components:\n\n[1] \"cluster\" \"centers\" \"totss\" \"withinss\" \"tot.withinss\" \"betweenss\"   \n[7] \"size\" \"iter\" \"ifault\"         \n<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Z wynik\u00f3w mo\u017cemy zobaczy\u0107, \u017ce:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Do pierwszego skupienia przypisano <b>16<\/b> stan\u00f3w<\/span><\/li>\n<li> <span style=\"color: #000000;\">Do drugiego skupienia przypisano <strong>13<\/strong> stan\u00f3w<\/span><\/li>\n<li> <span style=\"color: #000000;\">Do trzeciego skupienia przypisano <strong>13<\/strong> stan\u00f3w<\/span><\/li>\n<li> <span style=\"color: #000000;\">Do czwartego skupienia przypisano <b>8<\/b> stan\u00f3w<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Mo\u017cemy wizualizowa\u0107 skupienia na wykresie punktowym, kt\u00f3ry wy\u015bwietla pierwsze dwie g\u0142\u00f3wne sk\u0142adowe na osiach, u\u017cywaj\u0105c funkcji <strong>fivz_cluster()<\/strong> :<\/span> <\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#plot results of final k-means model\n<span style=\"color: #000000;\">fviz_cluster(km, data = df)\n<\/span><\/span><\/strong><\/pre>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-12313 \" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/kmmoyenne4.png\" alt=\"K-oznacza wykres grupuj\u0105cy w R\" width=\"475\" height=\"472\" srcset=\"\" sizes=\"auto, \"><\/p>\n<p> <span style=\"color: #000000;\">Mo\u017cemy r\u00f3wnie\u017c u\u017cy\u0107 funkcji <strong>Aggregate()<\/strong> , aby znale\u017a\u0107 \u015bredni\u0105 zmiennych w ka\u017cdym klastrze:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#find means of each cluster\n<span style=\"color: #000000;\">aggregate(USArrests, by= <span style=\"color: #3366ff;\">list<\/span> (cluster=km$cluster), mean)\n\ncluster Murder Assault UrbanPop Rape\n\t\t\t\t\n1 3.60000 78.53846 52.07692 12.17692\n2 10.81538 257.38462 76.00000 33.19231\n3 5.65625 138.87500 73.87500 18.78125\n4 13.93750 243.62500 53.75000 21.41250\n<\/span><\/span><\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Interpretujemy ten wynik w nast\u0119puj\u0105cy spos\u00f3b:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">\u015arednia liczba morderstw na 100 000 obywateli w pa\u0144stwach Grupy 1 wynosi <strong>3,6<\/strong> .<\/span><\/li>\n<li> <span style=\"color: #000000;\">\u015arednia liczba napa\u015bci na 100 000 obywateli w pa\u0144stwach Grupy 1 wynosi <strong>78,5<\/strong> .<\/span><\/li>\n<li> <span style=\"color: #000000;\">\u015aredni odsetek mieszka\u0144c\u00f3w zamieszkuj\u0105cych obszary miejskie w\u015br\u00f3d pa\u0144stw Grupy 1 wynosi <b>52,1%<\/b> .<\/span><\/li>\n<li> <span style=\"color: #000000;\">\u015arednia liczba gwa\u0142t\u00f3w na 100 000 obywateli w pa\u0144stwach Grupy 1 wynosi <strong>12,2<\/strong> <strong>.<\/strong><\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">I tak dalej.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Mo\u017cemy r\u00f3wnie\u017c doda\u0107 przypisania klastr\u00f3w ka\u017cdego stanu do oryginalnego zbioru danych:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#add cluster assignment to original data\n<span style=\"color: #000000;\">final_data &lt;- cbind(USArrests, cluster = km$cluster)\n<\/span>\n#view final data\n<span style=\"color: #000000;\">head(final_data)\n\n\t<\/span><span style=\"color: #000000;\">Murder Assault UrbanPop<\/span> <span style=\"color: #000000;\">Rape<\/span> <span style=\"color: #000000;\">cluster\n\t\t\t\t\nAlabama<\/span> <span style=\"color: #000000;\">13.2<\/span> <span style=\"color: #000000;\">236 58<\/span> <span style=\"color: #000000;\">21.2<\/span> <span style=\"color: #000000;\">4\nAlaska<\/span> <span style=\"color: #000000;\">10.0 263 48<\/span> <span style=\"color: #000000;\">44.5<\/span> <span style=\"color: #000000;\">2\nArizona<\/span> <span style=\"color: #000000;\">8.1 294 80<\/span> <span style=\"color: #000000;\">31.0<\/span> <span style=\"color: #000000;\">2\nArkansas<\/span> <span style=\"color: #000000;\">8.8 190 50<\/span> <span style=\"color: #000000;\">19.5<\/span> <span style=\"color: #000000;\">4\nCalifornia<\/span> <span style=\"color: #000000;\">9.0 276 91<\/span> <span style=\"color: #000000;\">40.6<\/span> <span style=\"color: #000000;\">2\nColorado<\/span> <span style=\"color: #000000;\">7.9 204 78<\/span> <span style=\"color: #000000;\">38.7<\/span> <span style=\"color: #000000;\">2\n<\/span><\/span><\/strong><\/pre>\n<h3> <span style=\"color: #000000;\"><strong>Zalety i wady grupowania K-\u015brednich<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Klastrowanie K-\u015brednich ma nast\u0119puj\u0105ce zalety:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">To szybki algorytm.<\/span><\/li>\n<li> <span style=\"color: #000000;\">Dobrze radzi sobie z du\u017cymi zbiorami danych.<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Ma jednak nast\u0119puj\u0105ce potencjalne wady:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Wymaga to od nas okre\u015blenia liczby klastr\u00f3w przed uruchomieniem algorytmu.<\/span><\/li>\n<li> <span style=\"color: #000000;\">Jest wra\u017cliwy na warto\u015bci odstaj\u0105ce.<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Dwie alternatywy dla grupowania k-\u015brednich to <a href=\"https:\/\/statorials.org\/pl\/k-medoidow-w-r\/\" target=\"_blank\" rel=\"noopener noreferrer\">grupowanie k-\u015brednich<\/a> i grupowanie hierarchiczne.<\/span><\/p>\n<hr>\n<p> <span style=\"color: #000000;\">Pe\u0142ny kod R u\u017cyty w tym przyk\u0142adzie znajdziesz <a href=\"https:\/\/github.com\/Statorials\/R-Guides\/blob\/main\/k_means.R\" target=\"_blank\" rel=\"noopener noreferrer\">tutaj<\/a> .<\/span><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Grupowanie to technika uczenia maszynowego, kt\u00f3ra pr\u00f3buje znale\u017a\u0107 grupy obserwacji w zbiorze danych. Celem jest znalezienie takich skupie\u0144, w kt\u00f3rych obserwacje w ka\u017cdym klastrze b\u0119d\u0105 do siebie do\u015b\u0107 podobne, podczas gdy obserwacje w r\u00f3\u017cnych skupieniach znacznie si\u0119 od siebie r\u00f3\u017cni\u0105. Klastrowanie jest form\u0105 uczenia si\u0119 bez nadzoru , poniewa\u017c po prostu staramy si\u0119 znale\u017a\u0107 struktur\u0119 [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[3],"tags":[],"class_list":["post-1242","post","type-post","status-publish","format-standard","hentry","category-przewodnik"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Grupowanie K-\u015brednich w R: Przyk\u0142ad krok po kroku - Statologia<\/title>\n<meta name=\"description\" content=\"Ten samouczek zawiera przyk\u0142ad krok po kroku wykonywania grupowania k-\u015brednich w j\u0119zyku R.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/pl\/k-oznacza-grupowanie-w-r\/\" \/>\n<meta property=\"og:locale\" content=\"pl_PL\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Grupowanie K-\u015brednich w R: Przyk\u0142ad krok po kroku - Statologia\" \/>\n<meta property=\"og:description\" content=\"Ten samouczek zawiera przyk\u0142ad krok po kroku wykonywania grupowania k-\u015brednich w j\u0119zyku R.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/pl\/k-oznacza-grupowanie-w-r\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-27T04:03:40+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/kmmoyenne1.png\" \/>\n<meta name=\"author\" content=\"Benjamin Anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Napisane przez\" \/>\n\t<meta name=\"twitter:data1\" content=\"Benjamin Anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Szacowany czas czytania\" \/>\n\t<meta name=\"twitter:data2\" content=\"6 minut\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/pl\/k-oznacza-grupowanie-w-r\/\",\"url\":\"https:\/\/statorials.org\/pl\/k-oznacza-grupowanie-w-r\/\",\"name\":\"Grupowanie K-\u015brednich w R: Przyk\u0142ad krok po kroku - Statologia\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/pl\/#website\"},\"datePublished\":\"2023-07-27T04:03:40+00:00\",\"dateModified\":\"2023-07-27T04:03:40+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/pl\/#\/schema\/person\/6484727a4612df3e69f016c3129c6965\"},\"description\":\"Ten samouczek zawiera przyk\u0142ad krok po kroku wykonywania grupowania k-\u015brednich w j\u0119zyku R.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/pl\/k-oznacza-grupowanie-w-r\/#breadcrumb\"},\"inLanguage\":\"pl-PL\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/pl\/k-oznacza-grupowanie-w-r\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/pl\/k-oznacza-grupowanie-w-r\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Dom\",\"item\":\"https:\/\/statorials.org\/pl\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Grupowanie k-\u015brednich w r: przyk\u0142ad krok po kroku\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/pl\/#website\",\"url\":\"https:\/\/statorials.org\/pl\/\",\"name\":\"Statorials\",\"description\":\"Tw\u00f3j przewodnik po kompetencjach statystycznych!\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/pl\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"pl-PL\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/pl\/#\/schema\/person\/6484727a4612df3e69f016c3129c6965\",\"name\":\"Benjamin Anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"pl-PL\",\"@id\":\"https:\/\/statorials.org\/pl\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/statorials.org\/pl\/wp-content\/uploads\/2023\/11\/Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"https:\/\/statorials.org\/pl\/wp-content\/uploads\/2023\/11\/Benjamin-Anderson-96x96.jpg\",\"caption\":\"Benjamin Anderson\"},\"description\":\"Cze\u015b\u0107, jestem Benjamin i jestem emerytowanym profesorem statystyki, kt\u00f3ry zosta\u0142 oddanym nauczycielem Statorials. Dzi\u0119ki bogatemu do\u015bwiadczeniu i wiedzy specjalistycznej w dziedzinie statystyki ch\u0119tnie dziel\u0119 si\u0119 swoj\u0105 wiedz\u0105, aby wzmocni\u0107 pozycj\u0119 uczni\u00f3w za po\u015brednictwem Statorials. Wiedzie\u0107 wi\u0119cej\",\"sameAs\":[\"https:\/\/statorials.org\/pl\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Grupowanie K-\u015brednich w R: Przyk\u0142ad krok po kroku - Statologia","description":"Ten samouczek zawiera przyk\u0142ad krok po kroku wykonywania grupowania k-\u015brednich w j\u0119zyku R.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/pl\/k-oznacza-grupowanie-w-r\/","og_locale":"pl_PL","og_type":"article","og_title":"Grupowanie K-\u015brednich w R: Przyk\u0142ad krok po kroku - Statologia","og_description":"Ten samouczek zawiera przyk\u0142ad krok po kroku wykonywania grupowania k-\u015brednich w j\u0119zyku R.","og_url":"https:\/\/statorials.org\/pl\/k-oznacza-grupowanie-w-r\/","og_site_name":"Statorials","article_published_time":"2023-07-27T04:03:40+00:00","og_image":[{"url":"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/kmmoyenne1.png"}],"author":"Benjamin Anderson","twitter_card":"summary_large_image","twitter_misc":{"Napisane przez":"Benjamin Anderson","Szacowany czas czytania":"6 minut"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/pl\/k-oznacza-grupowanie-w-r\/","url":"https:\/\/statorials.org\/pl\/k-oznacza-grupowanie-w-r\/","name":"Grupowanie K-\u015brednich w R: Przyk\u0142ad krok po kroku - Statologia","isPartOf":{"@id":"https:\/\/statorials.org\/pl\/#website"},"datePublished":"2023-07-27T04:03:40+00:00","dateModified":"2023-07-27T04:03:40+00:00","author":{"@id":"https:\/\/statorials.org\/pl\/#\/schema\/person\/6484727a4612df3e69f016c3129c6965"},"description":"Ten samouczek zawiera przyk\u0142ad krok po kroku wykonywania grupowania k-\u015brednich w j\u0119zyku R.","breadcrumb":{"@id":"https:\/\/statorials.org\/pl\/k-oznacza-grupowanie-w-r\/#breadcrumb"},"inLanguage":"pl-PL","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/pl\/k-oznacza-grupowanie-w-r\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/pl\/k-oznacza-grupowanie-w-r\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Dom","item":"https:\/\/statorials.org\/pl\/"},{"@type":"ListItem","position":2,"name":"Grupowanie k-\u015brednich w r: przyk\u0142ad krok po kroku"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/pl\/#website","url":"https:\/\/statorials.org\/pl\/","name":"Statorials","description":"Tw\u00f3j przewodnik po kompetencjach statystycznych!","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/pl\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"pl-PL"},{"@type":"Person","@id":"https:\/\/statorials.org\/pl\/#\/schema\/person\/6484727a4612df3e69f016c3129c6965","name":"Benjamin Anderson","image":{"@type":"ImageObject","inLanguage":"pl-PL","@id":"https:\/\/statorials.org\/pl\/#\/schema\/person\/image\/","url":"https:\/\/statorials.org\/pl\/wp-content\/uploads\/2023\/11\/Benjamin-Anderson-96x96.jpg","contentUrl":"https:\/\/statorials.org\/pl\/wp-content\/uploads\/2023\/11\/Benjamin-Anderson-96x96.jpg","caption":"Benjamin Anderson"},"description":"Cze\u015b\u0107, jestem Benjamin i jestem emerytowanym profesorem statystyki, kt\u00f3ry zosta\u0142 oddanym nauczycielem Statorials. Dzi\u0119ki bogatemu do\u015bwiadczeniu i wiedzy specjalistycznej w dziedzinie statystyki ch\u0119tnie dziel\u0119 si\u0119 swoj\u0105 wiedz\u0105, aby wzmocni\u0107 pozycj\u0119 uczni\u00f3w za po\u015brednictwem Statorials. Wiedzie\u0107 wi\u0119cej","sameAs":["https:\/\/statorials.org\/pl"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/pl\/wp-json\/wp\/v2\/posts\/1242","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/statorials.org\/pl\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/pl\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/pl\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/pl\/wp-json\/wp\/v2\/comments?post=1242"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/pl\/wp-json\/wp\/v2\/posts\/1242\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/pl\/wp-json\/wp\/v2\/media?parent=1242"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/pl\/wp-json\/wp\/v2\/categories?post=1242"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/pl\/wp-json\/wp\/v2\/tags?post=1242"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}