{"id":1431,"date":"2023-07-26T10:15:39","date_gmt":"2023-07-26T10:15:39","guid":{"rendered":"https:\/\/statorials.org\/pt\/dados-de-alta-dimensao\/"},"modified":"2023-07-26T10:15:39","modified_gmt":"2023-07-26T10:15:39","slug":"dados-de-alta-dimensao","status":"publish","type":"post","link":"https:\/\/statorials.org\/pt\/dados-de-alta-dimensao\/","title":{"rendered":"O que s\u00e3o dados de alta dimens\u00e3o? (defini\u00e7\u00e3o e exemplos)"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\"><strong>Dados de alta dimens\u00e3o<\/strong> referem-se a um conjunto de dados em que o n\u00famero de recursos <em>p<\/em> \u00e9 maior que o n\u00famero de <a href=\"https:\/\/statorials.org\/pt\/observacao-em-estatisticas\/\" target=\"_blank\" rel=\"noopener\">observa\u00e7\u00f5es<\/a> <em>N<\/em> , geralmente escrito como<\/span> <span style=\"color: #000000;\"><em>p<\/em> &gt;&gt; <em>N.<\/em><\/span><\/p>\n<p> <span style=\"color: #000000;\">Por exemplo, um conjunto de dados com <em>p<\/em> = 6 caracter\u00edsticas e apenas <em>N<\/em> = 3 observa\u00e7\u00f5es seria considerado dados de alta dimens\u00e3o porque o n\u00famero de caracter\u00edsticas \u00e9 maior que o n\u00famero de observa\u00e7\u00f5es.<\/span> <\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-14165 \" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/hautedim1.png\" alt=\"Dados de alta dimens\u00e3o\" width=\"593\" height=\"154\" srcset=\"\" sizes=\"auto, \"><\/p>\n<p> <span style=\"color: #000000;\">Um erro comum que as pessoas cometem \u00e9 presumir que \u201cdados de alta dimens\u00e3o\u201d significam simplesmente um conjunto de dados com muitos recursos. No entanto, isso est\u00e1 incorreto. Um conjunto de dados pode conter 10.000 caracter\u00edsticas, mas se contiver 100.000 observa\u00e7\u00f5es, n\u00e3o ser\u00e1 altamente dimensional.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><em><strong>Nota:<\/strong> Consulte o Cap\u00edtulo 18 <a href=\"https:\/\/web.stanford.edu\/~hastie\/Papers\/ESLII.pdf\" target=\"_blank\" rel=\"noopener\">de Elementos de Aprendizagem Estat\u00edstica<\/a> para uma discuss\u00e3o aprofundada da matem\u00e1tica por tr\u00e1s dos dados de alta dimens\u00e3o.<\/em><\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Por que os dados de alta dimens\u00e3o s\u00e3o um problema?<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Quando o n\u00famero de caracter\u00edsticas num conjunto de dados excede o n\u00famero de observa\u00e7\u00f5es, nunca teremos uma resposta determin\u00edstica.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Em outras palavras, torna-se imposs\u00edvel encontrar um modelo que possa descrever a rela\u00e7\u00e3o entre as vari\u00e1veis preditoras e a <a href=\"https:\/\/statorials.org\/pt\/respostas-explicativas-das-variaveis\/\" target=\"_blank\" rel=\"noopener\">vari\u00e1vel resposta<\/a> , porque n\u00e3o temos observa\u00e7\u00f5es suficientes para treinar o modelo.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Exemplos de dados de alta dimens\u00e3o<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Os exemplos a seguir ilustram conjuntos de dados de alta dimens\u00e3o em diferentes dom\u00ednios.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Exemplo 1: dados de sa\u00fade<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Dados de alta dimens\u00e3o s\u00e3o comuns em conjuntos de dados de sa\u00fade, onde o n\u00famero de caracter\u00edsticas de um determinado indiv\u00edduo pode ser enorme (ou seja, press\u00e3o arterial, frequ\u00eancia card\u00edaca em repouso, estado do sistema imunol\u00f3gico, hist\u00f3rico cir\u00fargico, altura, peso, condi\u00e7\u00f5es existentes, etc.).<\/span><\/p>\n<p> <span style=\"color: #000000;\">Nestes conjuntos de dados, \u00e9 comum que o n\u00famero de fei\u00e7\u00f5es seja maior que o n\u00famero de observa\u00e7\u00f5es.<\/span> <\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-14166 \" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/hautedim2.png\" alt=\"Exemplo de dados de alta dimens\u00e3o\" width=\"643\" height=\"140\" srcset=\"\" sizes=\"auto, \"><\/p>\n<p> <span style=\"color: #000000;\"><strong>Exemplo 2: dados financeiros<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Dados de alta dimens\u00e3o tamb\u00e9m s\u00e3o comuns em conjuntos de dados financeiros onde o n\u00famero de caracter\u00edsticas de uma determinada a\u00e7\u00e3o pode ser bastante grande (ou seja, \u00edndice PE, capitaliza\u00e7\u00e3o de mercado, volume de negocia\u00e7\u00e3o, taxa de dividendos, etc.)<\/span><\/p>\n<p> <span style=\"color: #000000;\">Nestes tipos de conjuntos de dados, \u00e9 comum que o n\u00famero de entidades seja muito maior que o n\u00famero de a\u00e7\u00f5es individuais.<\/span> <\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-14167 \" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/hautedim3.png\" alt=\"\" width=\"623\" height=\"125\" srcset=\"\" sizes=\"auto, \"><\/p>\n<p> <span style=\"color: #000000;\"><strong>Exemplo 3: Gen\u00f4mica<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Dados de alta dimens\u00e3o tamb\u00e9m s\u00e3o comuns no campo da gen\u00f4mica, onde o n\u00famero de caracter\u00edsticas gen\u00e9ticas de um determinado indiv\u00edduo pode ser enorme.<\/span> <\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-14168 \" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/hautedim4.png\" alt=\"\" width=\"662\" height=\"117\" srcset=\"\" sizes=\"auto, \"><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Como lidar com grandes dados<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Existem duas maneiras comuns de processar dados de alta dimens\u00e3o:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>1. Opte por incluir menos recursos.<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">A maneira mais \u00f3bvia de evitar lidar com dados de alta dimens\u00e3o \u00e9 simplesmente incluir menos recursos no conjunto de dados.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Existem v\u00e1rias maneiras de decidir quais recursos remover de um conjunto de dados, incluindo:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\"><strong>Remover recursos com muitos valores ausentes:<\/strong> se uma determinada coluna em um conjunto de dados tiver muitos valores ausentes, voc\u00ea poder\u00e1 remov\u00ea-la completamente sem perder muitas informa\u00e7\u00f5es.<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>Remover recursos de baixa varia\u00e7\u00e3o:<\/strong> se uma determinada coluna em um conjunto de dados tiver valores que mudam muito pouco, voc\u00ea poder\u00e1 remov\u00ea-la porque \u00e9 improv\u00e1vel que ela ofere\u00e7a tantas informa\u00e7\u00f5es \u00fateis sobre uma vari\u00e1vel de resposta quanto outros recursos.<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>Remova recursos com baixa correla\u00e7\u00e3o com a vari\u00e1vel de resposta:<\/strong> se um determinado recurso n\u00e3o estiver altamente correlacionado com a vari\u00e1vel de resposta de seu interesse, voc\u00ea provavelmente poder\u00e1 remov\u00ea-lo do conjunto de dados, pois \u00e9 improv\u00e1vel que seja um recurso \u00fatil em um modelo.<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\"><strong>2. Use um m\u00e9todo de regulariza\u00e7\u00e3o.<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Outra maneira de lidar com dados de alta dimens\u00e3o sem remover recursos do conjunto de dados \u00e9 usar uma t\u00e9cnica de regulariza\u00e7\u00e3o como:<\/span><\/p>\n<ul>\n<li> <a href=\"https:\/\/statorials.org\/pt\/analise-de-componentes-principais-em-r\/\" target=\"_blank\" rel=\"noopener\">An\u00e1lise do componente principal<\/a><\/li>\n<li> <a href=\"https:\/\/statorials.org\/pt\/regressao-de-componentes-principais\/\" target=\"_blank\" rel=\"noopener\">Regress\u00e3o de componentes principais<\/a><\/li>\n<li> <a href=\"https:\/\/statorials.org\/pt\/regressao-do-cume\/\" target=\"_blank\" rel=\"noopener\">Regress\u00e3o de pico<\/a><\/li>\n<li> <a href=\"https:\/\/statorials.org\/pt\/regressao-laco\/\" target=\"_blank\" rel=\"noopener\">Regress\u00e3o la\u00e7o<\/a><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Cada uma dessas t\u00e9cnicas pode ser usada para processar dados de alta dimens\u00e3o com efici\u00eancia.<\/span><\/p>\n<hr>\n<p> <span style=\"color: #000000;\"><em>Voc\u00ea pode encontrar uma lista completa de todos os tutoriais de aprendizado de m\u00e1quina estat\u00edstica <a href=\"https:\/\/statorials.org\/pt\/estatologia-explica-conceitos-de-forma-simples-e-direta-facilitamos-o-aprendizado-de-estatistica\/\" target=\"_blank\" rel=\"noopener\">nesta p\u00e1gina<\/a> .<\/em><\/span><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Dados de alta dimens\u00e3o referem-se a um conjunto de dados em que o n\u00famero de recursos p \u00e9 maior que o n\u00famero de observa\u00e7\u00f5es N , geralmente escrito como p &gt;&gt; N. Por exemplo, um conjunto de dados com p = 6 caracter\u00edsticas e apenas N = 3 observa\u00e7\u00f5es seria considerado dados de alta dimens\u00e3o [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"class_list":["post-1431","post","type-post","status-publish","format-standard","hentry","category-guia"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>O que s\u00e3o dados de alta dimens\u00e3o? (Defini\u00e7\u00e3o e exemplos)<\/title>\n<meta name=\"description\" content=\"Este tutorial fornece uma explica\u00e7\u00e3o de dados de alta dimens\u00e3o, incluindo uma defini\u00e7\u00e3o formal e v\u00e1rios exemplos.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/pt\/dados-de-alta-dimensao\/\" \/>\n<meta property=\"og:locale\" content=\"pt_PT\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"O que s\u00e3o dados de alta dimens\u00e3o? (Defini\u00e7\u00e3o e exemplos)\" \/>\n<meta property=\"og:description\" content=\"Este tutorial fornece uma explica\u00e7\u00e3o de dados de alta dimens\u00e3o, incluindo uma defini\u00e7\u00e3o formal e v\u00e1rios exemplos.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/pt\/dados-de-alta-dimensao\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-26T10:15:39+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/hautedim1.png\" \/>\n<meta name=\"author\" content=\"Dr. benjamim anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Escrito por\" \/>\n\t<meta name=\"twitter:data1\" content=\"Dr. benjamim anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Tempo estimado de leitura\" \/>\n\t<meta name=\"twitter:data2\" content=\"4 minutos\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/pt\/dados-de-alta-dimensao\/\",\"url\":\"https:\/\/statorials.org\/pt\/dados-de-alta-dimensao\/\",\"name\":\"O que s\u00e3o dados de alta dimens\u00e3o? (Defini\u00e7\u00e3o e exemplos)\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/pt\/#website\"},\"datePublished\":\"2023-07-26T10:15:39+00:00\",\"dateModified\":\"2023-07-26T10:15:39+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/pt\/#\/schema\/person\/e08f98e8db95e0aa9c310e1b27c9c666\"},\"description\":\"Este tutorial fornece uma explica\u00e7\u00e3o de dados de alta dimens\u00e3o, incluindo uma defini\u00e7\u00e3o formal e v\u00e1rios exemplos.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/pt\/dados-de-alta-dimensao\/#breadcrumb\"},\"inLanguage\":\"pt-PT\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/pt\/dados-de-alta-dimensao\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/pt\/dados-de-alta-dimensao\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Lar\",\"item\":\"https:\/\/statorials.org\/pt\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"O que s\u00e3o dados de alta dimens\u00e3o? (defini\u00e7\u00e3o e exemplos)\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/pt\/#website\",\"url\":\"https:\/\/statorials.org\/pt\/\",\"name\":\"Statorials\",\"description\":\"O seu guia para a literacia estat\u00edstica!\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/pt\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"pt-PT\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/pt\/#\/schema\/person\/e08f98e8db95e0aa9c310e1b27c9c666\",\"name\":\"Dr. benjamim anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"pt-PT\",\"@id\":\"https:\/\/statorials.org\/pt\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/statorials.org\/pt\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"https:\/\/statorials.org\/pt\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"caption\":\"Dr. benjamim anderson\"},\"description\":\"Ol\u00e1, sou Benjamin, um professor aposentado de estat\u00edstica que se tornou professor dedicado na Statorials. Com vasta experi\u00eancia e conhecimento na \u00e1rea de estat\u00edstica, estou empenhado em compartilhar meu conhecimento para capacitar os alunos por meio de Statorials. Saber mais\",\"sameAs\":[\"https:\/\/statorials.org\/pt\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"O que s\u00e3o dados de alta dimens\u00e3o? (Defini\u00e7\u00e3o e exemplos)","description":"Este tutorial fornece uma explica\u00e7\u00e3o de dados de alta dimens\u00e3o, incluindo uma defini\u00e7\u00e3o formal e v\u00e1rios exemplos.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/pt\/dados-de-alta-dimensao\/","og_locale":"pt_PT","og_type":"article","og_title":"O que s\u00e3o dados de alta dimens\u00e3o? (Defini\u00e7\u00e3o e exemplos)","og_description":"Este tutorial fornece uma explica\u00e7\u00e3o de dados de alta dimens\u00e3o, incluindo uma defini\u00e7\u00e3o formal e v\u00e1rios exemplos.","og_url":"https:\/\/statorials.org\/pt\/dados-de-alta-dimensao\/","og_site_name":"Statorials","article_published_time":"2023-07-26T10:15:39+00:00","og_image":[{"url":"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/hautedim1.png"}],"author":"Dr. benjamim anderson","twitter_card":"summary_large_image","twitter_misc":{"Escrito por":"Dr. benjamim anderson","Tempo estimado de leitura":"4 minutos"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/pt\/dados-de-alta-dimensao\/","url":"https:\/\/statorials.org\/pt\/dados-de-alta-dimensao\/","name":"O que s\u00e3o dados de alta dimens\u00e3o? (Defini\u00e7\u00e3o e exemplos)","isPartOf":{"@id":"https:\/\/statorials.org\/pt\/#website"},"datePublished":"2023-07-26T10:15:39+00:00","dateModified":"2023-07-26T10:15:39+00:00","author":{"@id":"https:\/\/statorials.org\/pt\/#\/schema\/person\/e08f98e8db95e0aa9c310e1b27c9c666"},"description":"Este tutorial fornece uma explica\u00e7\u00e3o de dados de alta dimens\u00e3o, incluindo uma defini\u00e7\u00e3o formal e v\u00e1rios exemplos.","breadcrumb":{"@id":"https:\/\/statorials.org\/pt\/dados-de-alta-dimensao\/#breadcrumb"},"inLanguage":"pt-PT","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/pt\/dados-de-alta-dimensao\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/pt\/dados-de-alta-dimensao\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Lar","item":"https:\/\/statorials.org\/pt\/"},{"@type":"ListItem","position":2,"name":"O que s\u00e3o dados de alta dimens\u00e3o? (defini\u00e7\u00e3o e exemplos)"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/pt\/#website","url":"https:\/\/statorials.org\/pt\/","name":"Statorials","description":"O seu guia para a literacia estat\u00edstica!","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/pt\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"pt-PT"},{"@type":"Person","@id":"https:\/\/statorials.org\/pt\/#\/schema\/person\/e08f98e8db95e0aa9c310e1b27c9c666","name":"Dr. benjamim anderson","image":{"@type":"ImageObject","inLanguage":"pt-PT","@id":"https:\/\/statorials.org\/pt\/#\/schema\/person\/image\/","url":"https:\/\/statorials.org\/pt\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","contentUrl":"https:\/\/statorials.org\/pt\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","caption":"Dr. benjamim anderson"},"description":"Ol\u00e1, sou Benjamin, um professor aposentado de estat\u00edstica que se tornou professor dedicado na Statorials. Com vasta experi\u00eancia e conhecimento na \u00e1rea de estat\u00edstica, estou empenhado em compartilhar meu conhecimento para capacitar os alunos por meio de Statorials. Saber mais","sameAs":["https:\/\/statorials.org\/pt"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/pt\/wp-json\/wp\/v2\/posts\/1431","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/statorials.org\/pt\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/pt\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/pt\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/pt\/wp-json\/wp\/v2\/comments?post=1431"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/pt\/wp-json\/wp\/v2\/posts\/1431\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/pt\/wp-json\/wp\/v2\/media?parent=1431"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/pt\/wp-json\/wp\/v2\/categories?post=1431"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/pt\/wp-json\/wp\/v2\/tags?post=1431"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}