{"id":2912,"date":"2023-07-20T03:12:14","date_gmt":"2023-07-20T03:12:14","guid":{"rendered":"https:\/\/statorials.org\/pl\/dopasowanie-rozmyte-w-r\/"},"modified":"2023-07-20T03:12:14","modified_gmt":"2023-07-20T03:12:14","slug":"dopasowanie-rozmyte-w-r","status":"publish","type":"post","link":"https:\/\/statorials.org\/pl\/dopasowanie-rozmyte-w-r\/","title":{"rendered":"Jak wykona\u0107 dopasowanie rozmyte w r (z przyk\u0142adem)"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\">Cz\u0119sto mo\u017cesz chcie\u0107 po\u0142\u0105czy\u0107 dwa zestawy danych w R w oparciu o niedok\u0142adnie pasuj\u0105ce ci\u0105gi. Nazywa si\u0119 to czasami <strong>dopasowaniem rozmytym<\/strong> .<\/span><\/p>\n<p> <span style=\"color: #000000;\">Naj\u0142atwiejszym sposobem przeprowadzenia dopasowywania rozmytego w R jest u\u017cycie funkcji <strong>stringdist_join()<\/strong> z pakietu <strong>fuzzyjoin<\/strong> .<\/span><\/p>\n<p> <span style=\"color: #000000;\">Poni\u017cszy przyk\u0142ad pokazuje, jak w praktyce wykorzysta\u0107 t\u0119 funkcj\u0119.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Przyk\u0142ad: dopasowanie rozmyte w R<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\"><span style=\"color: #000000;\">Za\u0142\u00f3\u017cmy, \u017ce w R mamy dwie ramki danych zawieraj\u0105ce informacje o r\u00f3\u017cnych dru\u017cynach koszyk\u00f3wki:<\/span><\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#create data frames<\/span>\ndf1 &lt;- data. <span style=\"color: #3366ff;\">frame<\/span> (team=c('Mavericks', 'Nets', 'Warriors', 'Heat', 'Lakers'),\n                  points=c(99, 90, 104, 117, 100))\ndf2 &lt;- data. <span style=\"color: #3366ff;\">frame<\/span> (team=c('Mavricks', 'Warrors', 'Heat', 'Netts', 'Kings', 'Lakes'),\n                  assists=c(22, 29, 17, 40, 32, 30))\n\n<span style=\"color: #008080;\">#view data frames\n<\/span><span style=\"color: #008000;\">print<\/span> (df1)\n\n       team points\n1 Mavericks 99\n2 Nets 90\n3 Warriors 104\n4 Heat 117\n5 Lakers 100\n\n<span style=\"color: #008000;\">print<\/span> (df2)\n\n      team assists\n1 Mavricks 22\n2 Warriors 29\n3 Heat 17\n4 Netts 40\n5 Kings 32\n6 Lakes 30\n<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Za\u0142\u00f3\u017cmy teraz, \u017ce chcemy wykona\u0107 <strong>lewe z\u0142\u0105czenie<\/strong> , w kt\u00f3rym zachowamy wszystkie wiersze z pierwszej ramki danych i po prostu po\u0142\u0105czymy je w oparciu o nazw\u0119 zespo\u0142u, kt\u00f3ra najbardziej pasuje do drugiej ramki danych.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Mo\u017cemy w tym celu u\u017cy\u0107 nast\u0119puj\u0105cego kodu:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <span style=\"color: #000000;\"><strong><span style=\"color: #008000;\">library<\/span> (fuzzyjoin)\n<span style=\"color: #008000;\">library<\/span> (dplyr)\n\n<span style=\"color: #008080;\">#perform fuzzy matching left join\n<\/span>stringdist_join(df1, df2, \n                by=' <span style=\"color: #ff0000;\">team<\/span> ', <span style=\"color: #008080;\">#match based on team<\/span>\n                mode=' <span style=\"color: #ff0000;\">left<\/span> ', <span style=\"color: #008080;\">#use left join<\/span>\n                method = \" <span style=\"color: #ff0000;\">jw<\/span> \", <span style=\"color: #008080;\">#use jw distance metric<\/span>\n                max_dist=99, \n                distance_col=' <span style=\"color: #ff0000;\">dist<\/span> ') %&gt;%\n  group_by(team.x) %&gt;%\n  slice_min(order_by=dist, n= <span style=\"color: #008000;\">1<\/span> )\n\n# A tibble: 5 x 5\n# Groups: team.x [5]\n  team.x points team.y assists dist\n                 \n1 Heat 117 Heat 17 0     \n2 Lakers 100 Lakes 30 0.0556\n3 Mavericks 99 Mavricks 22 0.0370\n4 Nets 90 Nets 40 0.0667\n5 Warriors 104 Warriors 29 0.0417\n<\/strong><\/span><\/pre>\n<p> <span style=\"color: #000000;\">Rezultatem jest ramka danych zawieraj\u0105ca ka\u017cd\u0105 z pi\u0119ciu oryginalnych nazw zespo\u0142\u00f3w z pierwszej ramki danych, a tak\u017ce zesp\u00f3\u0142, kt\u00f3ry najbardziej pasuje do drugiej ramki danych.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Uwaga nr 1<\/strong> : Do dopasowywania wybieramy metryk\u0119 odleg\u0142o\u015bci <strong>jw<\/strong> . Jest to skr\u00f3t od <a href=\"https:\/\/en.wikipedia.org\/wiki\/Jaro%E2%80%93Winkler_distance\" target=\"_blank\" rel=\"noopener\">odleg\u0142o\u015bci Jaro-Winklera<\/a> , kt\u00f3ra jest metryk\u0105 mierz\u0105c\u0105 r\u00f3\u017cnic\u0119 mi\u0119dzy dwoma ci\u0105gami znak\u00f3w.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Uwaga nr 2:<\/strong> U\u017cyli\u015bmy funkcji <strong>plaster_min()<\/strong> z pakietu dplyr, aby wy\u015bwietli\u0107 tylko nazw\u0119 zespo\u0142u z drugiej ramki danych, kt\u00f3ra najbardziej odpowiada nazwie zespo\u0142u z pierwszej ramki danych.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Dodatkowe zasoby<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Poni\u017csze samouczki wyja\u015bniaj\u0105, jak wykonywa\u0107 inne typowe zadania w j\u0119zyku R:<\/span><\/p>\n<p> <a href=\"https:\/\/statorials.org\/pl\/po\u0142aczyc-wiele-ramek-danych-w-r\/\" target=\"_blank\" rel=\"noopener\">Jak po\u0142\u0105czy\u0107 wiele ramek danych w R<\/a><br \/> <a href=\"https:\/\/statorials.org\/pl\/r-po\u0142acz-wiele-kolumn\/\" target=\"_blank\" rel=\"noopener\">Jak scali\u0107 ramki danych na podstawie wielu kolumn w R<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Cz\u0119sto mo\u017cesz chcie\u0107 po\u0142\u0105czy\u0107 dwa zestawy danych w R w oparciu o niedok\u0142adnie pasuj\u0105ce ci\u0105gi. Nazywa si\u0119 to czasami dopasowaniem rozmytym . Naj\u0142atwiejszym sposobem przeprowadzenia dopasowywania rozmytego w R jest u\u017cycie funkcji stringdist_join() z pakietu fuzzyjoin . Poni\u017cszy przyk\u0142ad pokazuje, jak w praktyce wykorzysta\u0107 t\u0119 funkcj\u0119. Przyk\u0142ad: dopasowanie rozmyte w R Za\u0142\u00f3\u017cmy, \u017ce w R [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[3],"tags":[],"class_list":["post-2912","post","type-post","status-publish","format-standard","hentry","category-przewodnik"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Jak wykona\u0107 dopasowywanie rozmyte w R (z przyk\u0142adem) - Statoriale<\/title>\n<meta name=\"description\" content=\"W tym samouczku wyja\u015bniono, na przyk\u0142adzie, jak przeprowadzi\u0107 dopasowanie rozmyte mi\u0119dzy dwoma zbiorami danych w j\u0119zyku R.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/pl\/dopasowanie-rozmyte-w-r\/\" \/>\n<meta property=\"og:locale\" content=\"pl_PL\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Jak wykona\u0107 dopasowywanie rozmyte w R (z przyk\u0142adem) - Statoriale\" \/>\n<meta property=\"og:description\" content=\"W tym samouczku wyja\u015bniono, na przyk\u0142adzie, jak przeprowadzi\u0107 dopasowanie rozmyte mi\u0119dzy dwoma zbiorami danych w j\u0119zyku R.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/pl\/dopasowanie-rozmyte-w-r\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-20T03:12:14+00:00\" \/>\n<meta name=\"author\" content=\"Benjamin Anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Napisane przez\" \/>\n\t<meta name=\"twitter:data1\" content=\"Benjamin Anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Szacowany czas czytania\" \/>\n\t<meta name=\"twitter:data2\" content=\"2 minuty\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/pl\/dopasowanie-rozmyte-w-r\/\",\"url\":\"https:\/\/statorials.org\/pl\/dopasowanie-rozmyte-w-r\/\",\"name\":\"Jak wykona\u0107 dopasowywanie rozmyte w R (z przyk\u0142adem) - Statoriale\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/pl\/#website\"},\"datePublished\":\"2023-07-20T03:12:14+00:00\",\"dateModified\":\"2023-07-20T03:12:14+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/pl\/#\/schema\/person\/6484727a4612df3e69f016c3129c6965\"},\"description\":\"W tym samouczku wyja\u015bniono, na przyk\u0142adzie, jak przeprowadzi\u0107 dopasowanie rozmyte mi\u0119dzy dwoma zbiorami danych w j\u0119zyku R.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/pl\/dopasowanie-rozmyte-w-r\/#breadcrumb\"},\"inLanguage\":\"pl-PL\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/pl\/dopasowanie-rozmyte-w-r\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/pl\/dopasowanie-rozmyte-w-r\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Dom\",\"item\":\"https:\/\/statorials.org\/pl\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Jak wykona\u0107 dopasowanie rozmyte w r (z przyk\u0142adem)\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/pl\/#website\",\"url\":\"https:\/\/statorials.org\/pl\/\",\"name\":\"Statorials\",\"description\":\"Tw\u00f3j przewodnik po kompetencjach statystycznych!\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/pl\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"pl-PL\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/pl\/#\/schema\/person\/6484727a4612df3e69f016c3129c6965\",\"name\":\"Benjamin Anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"pl-PL\",\"@id\":\"https:\/\/statorials.org\/pl\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/statorials.org\/pl\/wp-content\/uploads\/2023\/11\/Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"https:\/\/statorials.org\/pl\/wp-content\/uploads\/2023\/11\/Benjamin-Anderson-96x96.jpg\",\"caption\":\"Benjamin Anderson\"},\"description\":\"Cze\u015b\u0107, jestem Benjamin i jestem emerytowanym profesorem statystyki, kt\u00f3ry zosta\u0142 oddanym nauczycielem Statorials. Dzi\u0119ki bogatemu do\u015bwiadczeniu i wiedzy specjalistycznej w dziedzinie statystyki ch\u0119tnie dziel\u0119 si\u0119 swoj\u0105 wiedz\u0105, aby wzmocni\u0107 pozycj\u0119 uczni\u00f3w za po\u015brednictwem Statorials. Wiedzie\u0107 wi\u0119cej\",\"sameAs\":[\"https:\/\/statorials.org\/pl\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Jak wykona\u0107 dopasowywanie rozmyte w R (z przyk\u0142adem) - Statoriale","description":"W tym samouczku wyja\u015bniono, na przyk\u0142adzie, jak przeprowadzi\u0107 dopasowanie rozmyte mi\u0119dzy dwoma zbiorami danych w j\u0119zyku R.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/pl\/dopasowanie-rozmyte-w-r\/","og_locale":"pl_PL","og_type":"article","og_title":"Jak wykona\u0107 dopasowywanie rozmyte w R (z przyk\u0142adem) - Statoriale","og_description":"W tym samouczku wyja\u015bniono, na przyk\u0142adzie, jak przeprowadzi\u0107 dopasowanie rozmyte mi\u0119dzy dwoma zbiorami danych w j\u0119zyku R.","og_url":"https:\/\/statorials.org\/pl\/dopasowanie-rozmyte-w-r\/","og_site_name":"Statorials","article_published_time":"2023-07-20T03:12:14+00:00","author":"Benjamin Anderson","twitter_card":"summary_large_image","twitter_misc":{"Napisane przez":"Benjamin Anderson","Szacowany czas czytania":"2 minuty"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/pl\/dopasowanie-rozmyte-w-r\/","url":"https:\/\/statorials.org\/pl\/dopasowanie-rozmyte-w-r\/","name":"Jak wykona\u0107 dopasowywanie rozmyte w R (z przyk\u0142adem) - Statoriale","isPartOf":{"@id":"https:\/\/statorials.org\/pl\/#website"},"datePublished":"2023-07-20T03:12:14+00:00","dateModified":"2023-07-20T03:12:14+00:00","author":{"@id":"https:\/\/statorials.org\/pl\/#\/schema\/person\/6484727a4612df3e69f016c3129c6965"},"description":"W tym samouczku wyja\u015bniono, na przyk\u0142adzie, jak przeprowadzi\u0107 dopasowanie rozmyte mi\u0119dzy dwoma zbiorami danych w j\u0119zyku R.","breadcrumb":{"@id":"https:\/\/statorials.org\/pl\/dopasowanie-rozmyte-w-r\/#breadcrumb"},"inLanguage":"pl-PL","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/pl\/dopasowanie-rozmyte-w-r\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/pl\/dopasowanie-rozmyte-w-r\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Dom","item":"https:\/\/statorials.org\/pl\/"},{"@type":"ListItem","position":2,"name":"Jak wykona\u0107 dopasowanie rozmyte w r (z przyk\u0142adem)"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/pl\/#website","url":"https:\/\/statorials.org\/pl\/","name":"Statorials","description":"Tw\u00f3j przewodnik po kompetencjach statystycznych!","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/pl\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"pl-PL"},{"@type":"Person","@id":"https:\/\/statorials.org\/pl\/#\/schema\/person\/6484727a4612df3e69f016c3129c6965","name":"Benjamin Anderson","image":{"@type":"ImageObject","inLanguage":"pl-PL","@id":"https:\/\/statorials.org\/pl\/#\/schema\/person\/image\/","url":"https:\/\/statorials.org\/pl\/wp-content\/uploads\/2023\/11\/Benjamin-Anderson-96x96.jpg","contentUrl":"https:\/\/statorials.org\/pl\/wp-content\/uploads\/2023\/11\/Benjamin-Anderson-96x96.jpg","caption":"Benjamin Anderson"},"description":"Cze\u015b\u0107, jestem Benjamin i jestem emerytowanym profesorem statystyki, kt\u00f3ry zosta\u0142 oddanym nauczycielem Statorials. Dzi\u0119ki bogatemu do\u015bwiadczeniu i wiedzy specjalistycznej w dziedzinie statystyki ch\u0119tnie dziel\u0119 si\u0119 swoj\u0105 wiedz\u0105, aby wzmocni\u0107 pozycj\u0119 uczni\u00f3w za po\u015brednictwem Statorials. Wiedzie\u0107 wi\u0119cej","sameAs":["https:\/\/statorials.org\/pl"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/pl\/wp-json\/wp\/v2\/posts\/2912","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/statorials.org\/pl\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/pl\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/pl\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/pl\/wp-json\/wp\/v2\/comments?post=2912"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/pl\/wp-json\/wp\/v2\/posts\/2912\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/pl\/wp-json\/wp\/v2\/media?parent=2912"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/pl\/wp-json\/wp\/v2\/categories?post=2912"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/pl\/wp-json\/wp\/v2\/tags?post=2912"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}