{"id":947,"date":"2023-07-28T05:33:50","date_gmt":"2023-07-28T05:33:50","guid":{"rendered":"https:\/\/statorials.org\/nl\/groeps-cv-gegevens-r\/"},"modified":"2023-07-28T05:33:50","modified_gmt":"2023-07-28T05:33:50","slug":"groeps-cv-gegevens-r","status":"publish","type":"post","link":"https:\/\/statorials.org\/nl\/groeps-cv-gegevens-r\/","title":{"rendered":"De complete gids: gegevens groeperen en samenvatten in r"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\">Twee van de meest voorkomende taken die u uitvoert bij het analyseren van gegevens zijn het groeperen en samenvatten van gegevens.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Gelukkig kun je met het <a href=\"https:\/\/dplyr.tidyverse.org\/\" target=\"_blank\" rel=\"noopener noreferrer\">dplyr-<\/a> pakket in R snel gegevens groeperen en samenvatten.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Deze tutorial biedt een korte handleiding om aan de slag te gaan met dplyr.<\/span><\/p>\n<h2> <span style=\"color: #000000;\"><strong>Installeer en laad het dplyr-pakket<\/strong><\/span><\/h2>\n<p> <span style=\"color: #000000;\">Voordat u de functies in het dplyr-pakket kunt gebruiken, moet u eerst het pakket laden:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#install dplyr (if not already installed)\n<span style=\"color: #000000;\">install.packages(' <span style=\"color: #008000;\">dplyr<\/span> ')<\/span>\n\n#load dplyr<\/span> \nlibrary(dplyr)<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Vervolgens illustreren we verschillende voorbeelden van het gebruik van de functies van dplyr om gegevens te groeperen en samen te vatten met behulp van de ingebouwde R-dataset genaamd <strong>mtcars<\/strong> :<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#obtain rows and columns of <em>mtcars<\/em><\/span>\ndim(mtcars)\n\n[1] 32 11\n\n<span style=\"color: #008080;\">#view first six rows of <em>mtcars<\/em>\n<\/span>head(mtcars)\n\n                   mpg cyl disp hp drat wt qsec vs am gear carb\nMazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4\nMazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4\nDatsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1\nHornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1\nHornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2\nValiant 18.1 6 225 105 2.76 3,460 20.22 1 0 3 1<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">De basissyntaxis die we zullen gebruiken om gegevens te groeperen en samen te vatten is:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong>data %&gt;%\n  <span style=\"color: #3366ff;\">group_by<\/span> (col_name) %&gt;%\n  <span style=\"color: #3366ff;\">summarize<\/span> (summary_name = summary_function)\n<\/strong><\/pre>\n<p> <span style=\"color: #000000;\"><em><strong>Opmerking:<\/strong> de functies summary() en summarise() zijn gelijkwaardig.<\/em><\/span><\/p>\n<h2> <strong>Voorbeeld 1: Zoek het gemiddelde en de mediaan per groep<\/strong><\/h2>\n<p> <span style=\"color: #000000;\">De volgende code laat zien hoe u <a href=\"https:\/\/statorials.org\/nl\/meet-de-centrale-tendens\/\" target=\"_blank\" rel=\"noopener noreferrer\">metingen van de centrale tendens<\/a> per groep kunt berekenen, inclusief het gemiddelde en de mediaan:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#find mean mpg by cylinder<\/span>\nmtcars %&gt;%\n  <span style=\"color: #3366ff;\">group_by<\/span> (cyl) %&gt;%\n  <span style=\"color: #3366ff;\">summarize<\/span> (mean_mpg = mean(mpg, na.rm = <span style=\"color: #008000;\">TRUE<\/span> ))\n\n# A tibble: 3 x 2\n    cyl mean_mpg\n      \n1 4 26.7\n2 6 19.7\n3 8 15.1\n\n<span style=\"color: #008080;\">#find median mpg by cylinder\n<\/span>mtcars %&gt;%\n  <span style=\"color: #3366ff;\">group_by<\/span> (cyl) %&gt;%\n  <span style=\"color: #3366ff;\">summarize<\/span> (median_mpg = median(mpg, na.rm = <span style=\"color: #008000;\">TRUE<\/span> ))\n\n# A tibble: 3 x 2\n    cyl median_mpg\n        \n1 4 26  \n2 6 19.7\n3 8 15.2<\/strong><\/pre>\n<h2> <strong>Voorbeeld 2: Het vinden van spreidingsmaatstaven per groep<\/strong><\/h2>\n<p> <span style=\"color: #000000;\">De volgende code laat zien hoe u spreidingsmaten per groep kunt berekenen, inclusief standaardafwijking, interkwartielbereik en absolute mediaanafwijking:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#find sd, IQR, and mad by cylinder<\/span>\nmtcars %&gt;%\n<span style=\"color: #3366ff;\">group_by<\/span> (cyl) %&gt;%\n<span style=\"color: #3366ff;\">summarize<\/span> (sd_mpg = sd(mpg, na.rm = <span style=\"color: #008000;\">TRUE<\/span> ),\n            iqr_mpg = IQR(mpg, na.rm = <span style=\"color: #008000;\">TRUE<\/span> ),\n            mad_mpg = mad(mpg, na.rm = <span style=\"color: #008000;\">TRUE<\/span> ))\n\n# A tibble: 3 x 4\n    cyl sd_mpg iqr_mpg mad_mpg\n          \n1 4 4.51 7.60 6.52\n2 6 1.45 2.35 1.93\n3 8 2.56 1.85 1.56<\/strong><\/pre>\n<h2> <strong>Voorbeeld 3: Zoek nummer per groep<\/strong><\/h2>\n<p> <span style=\"color: #000000;\">De volgende code laat zien hoe je het nummer en het unieke nummer per groep in R kunt vinden:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#find row count and unique row count by cylinder<\/span>\nmtcars %&gt;%\n<span style=\"color: #3366ff;\">group_by<\/span> (cyl) %&gt;%\n<span style=\"color: #3366ff;\">summarize<\/span> (count_mpg = n(),\n            u_count_mpg = n_distinct(mpg))\n\n# A tibble: 3 x 3\n    cyl count_mpg u_count_mpg\n              \n1 4 11 9\n2 6 7 6\n3 8 14 12\n<\/strong><\/pre>\n<h2> <strong>Voorbeeld 4: Zoek percentiel per groep<\/strong><\/h2>\n<p> <span style=\"color: #000000;\">De volgende code laat zien hoe u het 90e percentiel van mpg-waarden per cilindergroep kunt vinden:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#find 90th percentile of mpg for each cylinder group<\/span>\nmtcars %&gt;%\n<span style=\"color: #3366ff;\">group_by<\/span> (cyl) %&gt;%\n<span style=\"color: #3366ff;\">summarize<\/span> (quant90 = quantile(mpg, probs = .9))\n\n# A tibble: 3 x 2\n    cyl quant90\n     \n1 4 32.4\n2 6 21.2\n3 8 18.3<\/strong><\/pre>\n<h2> <span style=\"color: #000000;\"><strong>Aanvullende bronnen<\/strong><\/span><\/h2>\n<p> <span style=\"color: #000000;\">U kunt <a href=\"https:\/\/dplyr.tidyverse.org\/\" target=\"_blank\" rel=\"noopener noreferrer\">hier<\/a> de volledige documentatie van het dplyr-pakket en handige spiekbriefjes voor visualisatie vinden.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Andere handige functies die u kunt gebruiken met <strong>group_by()<\/strong> en <strong>summary()<\/strong> zijn onder meer functies om <a href=\"https:\/\/statorials.org\/nl\/filter-rijen-r\/\" target=\"_blank\" rel=\"noopener noreferrer\">de rijen van het dataframe te filteren<\/a> en <a href=\"https:\/\/statorials.org\/nl\/organiseer-de-lijnen-r\/\" target=\"_blank\" rel=\"noopener noreferrer\">ze in bepaalde volgorde te rangschikken<\/a> .<\/span><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Twee van de meest voorkomende taken die u uitvoert bij het analyseren van gegevens zijn het groeperen en samenvatten van gegevens. Gelukkig kun je met het dplyr- pakket in R snel gegevens groeperen en samenvatten. Deze tutorial biedt een korte handleiding om aan de slag te gaan met dplyr. Installeer en laad het dplyr-pakket Voordat [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"class_list":["post-947","post","type-post","status-publish","format-standard","hentry","category-gids"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>De complete gids: gegevens groeperen en samenvatten in R<\/title>\n<meta name=\"description\" content=\"Een complete gids voor het groeperen en samenvatten van gegevens in R, met behulp van functies uit de dplyr-bibliotheek.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/nl\/groeps-cv-gegevens-r\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"De complete gids: gegevens groeperen en samenvatten in R\" \/>\n<meta property=\"og:description\" content=\"Een complete gids voor het groeperen en samenvatten van gegevens in R, met behulp van functies uit de dplyr-bibliotheek.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/nl\/groeps-cv-gegevens-r\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-28T05:33:50+00:00\" \/>\n<meta name=\"author\" content=\"Dr.benjamin anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"Dr.benjamin anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"2\u00a0Minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/nl\/groeps-cv-gegevens-r\/\",\"url\":\"https:\/\/statorials.org\/nl\/groeps-cv-gegevens-r\/\",\"name\":\"De complete gids: gegevens groeperen en samenvatten in R\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/nl\/#website\"},\"datePublished\":\"2023-07-28T05:33:50+00:00\",\"dateModified\":\"2023-07-28T05:33:50+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\"},\"description\":\"Een complete gids voor het groeperen en samenvatten van gegevens in R, met behulp van functies uit de dplyr-bibliotheek.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/nl\/groeps-cv-gegevens-r\/#breadcrumb\"},\"inLanguage\":\"de\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/nl\/groeps-cv-gegevens-r\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/nl\/groeps-cv-gegevens-r\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Thuis\",\"item\":\"https:\/\/statorials.org\/nl\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"De complete gids: gegevens groeperen en samenvatten in r\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/nl\/#website\",\"url\":\"https:\/\/statorials.org\/nl\/\",\"name\":\"Statorials\",\"description\":\"Uw gids voor statistische competentie\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/nl\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"de\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\",\"name\":\"Dr.benjamin anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/\",\"url\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"caption\":\"Dr.benjamin anderson\"},\"description\":\"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder\",\"sameAs\":[\"http:\/\/statorials.org\/nl\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"De complete gids: gegevens groeperen en samenvatten in R","description":"Een complete gids voor het groeperen en samenvatten van gegevens in R, met behulp van functies uit de dplyr-bibliotheek.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/nl\/groeps-cv-gegevens-r\/","og_locale":"de_DE","og_type":"article","og_title":"De complete gids: gegevens groeperen en samenvatten in R","og_description":"Een complete gids voor het groeperen en samenvatten van gegevens in R, met behulp van functies uit de dplyr-bibliotheek.","og_url":"https:\/\/statorials.org\/nl\/groeps-cv-gegevens-r\/","og_site_name":"Statorials","article_published_time":"2023-07-28T05:33:50+00:00","author":"Dr.benjamin anderson","twitter_card":"summary_large_image","twitter_misc":{"Verfasst von":"Dr.benjamin anderson","Gesch\u00e4tzte Lesezeit":"2\u00a0Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/nl\/groeps-cv-gegevens-r\/","url":"https:\/\/statorials.org\/nl\/groeps-cv-gegevens-r\/","name":"De complete gids: gegevens groeperen en samenvatten in R","isPartOf":{"@id":"https:\/\/statorials.org\/nl\/#website"},"datePublished":"2023-07-28T05:33:50+00:00","dateModified":"2023-07-28T05:33:50+00:00","author":{"@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219"},"description":"Een complete gids voor het groeperen en samenvatten van gegevens in R, met behulp van functies uit de dplyr-bibliotheek.","breadcrumb":{"@id":"https:\/\/statorials.org\/nl\/groeps-cv-gegevens-r\/#breadcrumb"},"inLanguage":"de","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/nl\/groeps-cv-gegevens-r\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/nl\/groeps-cv-gegevens-r\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Thuis","item":"https:\/\/statorials.org\/nl\/"},{"@type":"ListItem","position":2,"name":"De complete gids: gegevens groeperen en samenvatten in r"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/nl\/#website","url":"https:\/\/statorials.org\/nl\/","name":"Statorials","description":"Uw gids voor statistische competentie","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/nl\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"de"},{"@type":"Person","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219","name":"Dr.benjamin anderson","image":{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/","url":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","contentUrl":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","caption":"Dr.benjamin anderson"},"description":"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder","sameAs":["http:\/\/statorials.org\/nl"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/947","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/comments?post=947"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/947\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/media?parent=947"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/categories?post=947"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/tags?post=947"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}