{"id":1432,"date":"2023-07-26T10:15:39","date_gmt":"2023-07-26T10:15:39","guid":{"rendered":"https:\/\/statorials.org\/nl\/hoge-dimensionale-gegevens\/"},"modified":"2023-07-26T10:15:39","modified_gmt":"2023-07-26T10:15:39","slug":"hoge-dimensionale-gegevens","status":"publish","type":"post","link":"https:\/\/statorials.org\/nl\/hoge-dimensionale-gegevens\/","title":{"rendered":"Wat zijn hoogdimensionale gegevens? (definitie &amp; voorbeelden)"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\"><strong>Hoogdimensionale gegevens<\/strong> verwijzen naar een gegevensset waarin het aantal kenmerken <em>p<\/em> groter is dan het aantal <a href=\"https:\/\/statorials.org\/nl\/observatie-in-de-statistiek\/\" target=\"_blank\" rel=\"noopener\">waarnemingen<\/a> <em>N<\/em> , vaak geschreven als<\/span> <span style=\"color: #000000;\"><em>p<\/em> &gt;&gt; <em>N.<\/em><\/span><\/p>\n<p> <span style=\"color: #000000;\">Een dataset met <em>p<\/em> = 6 kenmerken en slechts <em>N<\/em> = 3 waarnemingen zou bijvoorbeeld als hoogdimensionale gegevens worden beschouwd omdat het aantal kenmerken groter is dan het aantal waarnemingen.<\/span> <\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-14165 \" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/hautedim1.png\" alt=\"Hoogdimensionale gegevens\" width=\"593\" height=\"154\" srcset=\"\" sizes=\"auto, \"><\/p>\n<p> <span style=\"color: #000000;\">Een veelgemaakte fout die mensen maken, is te veronderstellen dat \u2018hoogdimensionale gegevens\u2019 eenvoudigweg een dataset met veel functies betekenen. Dit is echter onjuist. Een dataset kan 10.000 kenmerken bevatten, maar als deze 100.000 waarnemingen bevat, is deze niet hoogdimensionaal.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><em><strong>Opmerking:<\/strong> Zie hoofdstuk 18 <a href=\"https:\/\/web.stanford.edu\/~hastie\/Papers\/ESLII.pdf\" target=\"_blank\" rel=\"noopener\">van Elementen van statistisch leren<\/a> voor een diepgaande discussie over de wiskunde achter hoogdimensionale gegevens.<\/em><\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Waarom zijn hoogdimensionale gegevens een probleem?<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Wanneer het aantal kenmerken in een dataset het aantal waarnemingen overschrijdt, zullen we nooit een deterministisch antwoord hebben.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Met andere woorden: het wordt onmogelijk om een model te vinden dat de relatie tussen de voorspellende variabelen en de<a href=\"https:\/\/statorials.org\/nl\/variabelen-verklarende-reacties\/\" target=\"_blank\" rel=\"noopener\">responsvariabele<\/a> kan beschrijven, omdat we niet genoeg observaties hebben waarop we het model kunnen trainen.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Voorbeelden van hoogdimensionale gegevens<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">De volgende voorbeelden illustreren hoogdimensionale datasets in verschillende domeinen.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Voorbeeld 1: Gezondheidsgegevens<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Hoogdimensionale gegevens zijn gebruikelijk in datasets in de gezondheidszorg, waarbij het aantal kenmerken voor een bepaald individu enorm kan zijn (dwz bloeddruk, hartslag in rust, status van het immuunsysteem, chirurgische geschiedenis, lengte, gewicht, bestaande aandoeningen, enz.).<\/span><\/p>\n<p> <span style=\"color: #000000;\">In deze datasets is het gebruikelijk dat het aantal kenmerken groter is dan het aantal waarnemingen.<\/span> <\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-14166 \" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/hautedim2.png\" alt=\"Voorbeeld van hoogdimensionale gegevens\" width=\"643\" height=\"140\" srcset=\"\" sizes=\"auto, \"><\/p>\n<p> <span style=\"color: #000000;\"><strong>Voorbeeld 2: financi\u00eble gegevens<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Hoogdimensionale gegevens komen ook vaak voor in financi\u00eble datasets waar het aantal kenmerken voor een bepaald aandeel behoorlijk groot kan zijn (dat wil zeggen koers-winstverhouding, marktkapitalisatie, handelsvolume, dividendpercentage, enz.)<\/span><\/p>\n<p> <span style=\"color: #000000;\">Bij dit soort datasets is het gebruikelijk dat het aantal entiteiten veel groter is dan het aantal individuele acties.<\/span> <\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-14167 \" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/hautedim3.png\" alt=\"\" width=\"623\" height=\"125\" srcset=\"\" sizes=\"auto, \"><\/p>\n<p> <span style=\"color: #000000;\"><strong>Voorbeeld 3: Genomica<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Hoogdimensionale gegevens zijn ook gebruikelijk op het gebied van de genomica, waar het aantal genetische kenmerken van een bepaald individu enorm kan zijn.<\/span> <\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-14168 \" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/hautedim4.png\" alt=\"\" width=\"662\" height=\"117\" srcset=\"\" sizes=\"auto, \"><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Hoe om te gaan met grote data<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Er zijn twee veelgebruikte manieren om hoogdimensionale gegevens te verwerken:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>1. Kies ervoor om minder functies op te nemen.<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">De meest voor de hand liggende manier om te voorkomen dat u met hoogdimensionale gegevens te maken krijgt, is door simpelweg minder kenmerken in de gegevensset op te nemen.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Er zijn verschillende manieren om te beslissen welke functies u uit een gegevensset wilt verwijderen, waaronder:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\"><strong>Functies met veel ontbrekende waarden verwijderen:<\/strong> Als een bepaalde kolom in een gegevensset veel ontbrekende waarden bevat, kunt u deze mogelijk volledig verwijderen zonder veel informatie te verliezen.<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>Kenmerken met lage variantie verwijderen:<\/strong> Als een bepaalde kolom in een dataset waarden heeft die weinig veranderen, kunt u deze mogelijk verwijderen omdat het onwaarschijnlijk is dat deze zoveel nuttige informatie over een responsvariabele biedt als andere kenmerken.<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>Verwijder functies met een lage correlatie met de responsvariabele:<\/strong> Als een bepaald kenmerk niet sterk gecorreleerd is met de responsvariabele waarin u ge\u00efnteresseerd bent, kunt u het waarschijnlijk uit de dataset verwijderen, omdat het onwaarschijnlijk is dat dit een nuttig kenmerk in een model is.<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\"><strong>2. Gebruik een regularisatiemethode.<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Een andere manier om hoogdimensionale gegevens te verwerken zonder kenmerken uit de dataset te verwijderen, is door een regularisatietechniek te gebruiken, zoals:<\/span><\/p>\n<ul>\n<li> <a href=\"https:\/\/statorials.org\/nl\/hoofdcomponentenanalyse-in-r\/\" target=\"_blank\" rel=\"noopener\">Hoofdcomponentenanalyse<\/a><\/li>\n<li> <a href=\"https:\/\/statorials.org\/nl\/regressie-van-hoofdcomponenten\/\" target=\"_blank\" rel=\"noopener\">Regressie van hoofdcomponenten<\/a><\/li>\n<li> <a href=\"https:\/\/statorials.org\/nl\/regressie-van-de-bergkam\/\" target=\"_blank\" rel=\"noopener\">Piekregressie<\/a><\/li>\n<li> <a href=\"https:\/\/statorials.org\/nl\/lasso-regressie\/\" target=\"_blank\" rel=\"noopener\">Lasso-regressie<\/a><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Elk van deze technieken kan worden gebruikt om hoogdimensionale gegevens effici\u00ebnt te verwerken.<\/span><\/p>\n<hr>\n<p> <span style=\"color: #000000;\"><em>Op deze pagina vindt u een volledige lijst van alle tutorials over statistische machine learning.<\/em><\/span><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Hoogdimensionale gegevens verwijzen naar een gegevensset waarin het aantal kenmerken p groter is dan het aantal waarnemingen N , vaak geschreven als p &gt;&gt; N. Een dataset met p = 6 kenmerken en slechts N = 3 waarnemingen zou bijvoorbeeld als hoogdimensionale gegevens worden beschouwd omdat het aantal kenmerken groter is dan het aantal waarnemingen. [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"class_list":["post-1432","post","type-post","status-publish","format-standard","hentry","category-gids"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Wat zijn hoogdimensionale gegevens? (Definitie en voorbeelden)<\/title>\n<meta name=\"description\" content=\"Deze tutorial geeft uitleg over hoogdimensionale gegevens, inclusief een formele definitie en verschillende voorbeelden.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/nl\/hoge-dimensionale-gegevens\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Wat zijn hoogdimensionale gegevens? (Definitie en voorbeelden)\" \/>\n<meta property=\"og:description\" content=\"Deze tutorial geeft uitleg over hoogdimensionale gegevens, inclusief een formele definitie en verschillende voorbeelden.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/nl\/hoge-dimensionale-gegevens\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-26T10:15:39+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/hautedim1.png\" \/>\n<meta name=\"author\" content=\"Dr.benjamin anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"Dr.benjamin anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"3\u00a0Minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/nl\/hoge-dimensionale-gegevens\/\",\"url\":\"https:\/\/statorials.org\/nl\/hoge-dimensionale-gegevens\/\",\"name\":\"Wat zijn hoogdimensionale gegevens? (Definitie en voorbeelden)\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/nl\/#website\"},\"datePublished\":\"2023-07-26T10:15:39+00:00\",\"dateModified\":\"2023-07-26T10:15:39+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\"},\"description\":\"Deze tutorial geeft uitleg over hoogdimensionale gegevens, inclusief een formele definitie en verschillende voorbeelden.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/nl\/hoge-dimensionale-gegevens\/#breadcrumb\"},\"inLanguage\":\"de\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/nl\/hoge-dimensionale-gegevens\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/nl\/hoge-dimensionale-gegevens\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Thuis\",\"item\":\"https:\/\/statorials.org\/nl\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Wat zijn hoogdimensionale gegevens? (definitie &amp; voorbeelden)\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/nl\/#website\",\"url\":\"https:\/\/statorials.org\/nl\/\",\"name\":\"Statorials\",\"description\":\"Uw gids voor statistische competentie\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/nl\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"de\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\",\"name\":\"Dr.benjamin anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/\",\"url\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"caption\":\"Dr.benjamin anderson\"},\"description\":\"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder\",\"sameAs\":[\"http:\/\/statorials.org\/nl\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Wat zijn hoogdimensionale gegevens? (Definitie en voorbeelden)","description":"Deze tutorial geeft uitleg over hoogdimensionale gegevens, inclusief een formele definitie en verschillende voorbeelden.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/nl\/hoge-dimensionale-gegevens\/","og_locale":"de_DE","og_type":"article","og_title":"Wat zijn hoogdimensionale gegevens? (Definitie en voorbeelden)","og_description":"Deze tutorial geeft uitleg over hoogdimensionale gegevens, inclusief een formele definitie en verschillende voorbeelden.","og_url":"https:\/\/statorials.org\/nl\/hoge-dimensionale-gegevens\/","og_site_name":"Statorials","article_published_time":"2023-07-26T10:15:39+00:00","og_image":[{"url":"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/hautedim1.png"}],"author":"Dr.benjamin anderson","twitter_card":"summary_large_image","twitter_misc":{"Verfasst von":"Dr.benjamin anderson","Gesch\u00e4tzte Lesezeit":"3\u00a0Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/nl\/hoge-dimensionale-gegevens\/","url":"https:\/\/statorials.org\/nl\/hoge-dimensionale-gegevens\/","name":"Wat zijn hoogdimensionale gegevens? (Definitie en voorbeelden)","isPartOf":{"@id":"https:\/\/statorials.org\/nl\/#website"},"datePublished":"2023-07-26T10:15:39+00:00","dateModified":"2023-07-26T10:15:39+00:00","author":{"@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219"},"description":"Deze tutorial geeft uitleg over hoogdimensionale gegevens, inclusief een formele definitie en verschillende voorbeelden.","breadcrumb":{"@id":"https:\/\/statorials.org\/nl\/hoge-dimensionale-gegevens\/#breadcrumb"},"inLanguage":"de","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/nl\/hoge-dimensionale-gegevens\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/nl\/hoge-dimensionale-gegevens\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Thuis","item":"https:\/\/statorials.org\/nl\/"},{"@type":"ListItem","position":2,"name":"Wat zijn hoogdimensionale gegevens? (definitie &amp; voorbeelden)"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/nl\/#website","url":"https:\/\/statorials.org\/nl\/","name":"Statorials","description":"Uw gids voor statistische competentie","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/nl\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"de"},{"@type":"Person","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219","name":"Dr.benjamin anderson","image":{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/","url":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","contentUrl":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","caption":"Dr.benjamin anderson"},"description":"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder","sameAs":["http:\/\/statorials.org\/nl"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/1432","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/comments?post=1432"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/1432\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/media?parent=1432"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/categories?post=1432"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/tags?post=1432"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}