{"id":1181,"date":"2023-07-27T09:18:03","date_gmt":"2023-07-27T09:18:03","guid":{"rendered":"https:\/\/statorials.org\/pt\/selecao-por-etapas\/"},"modified":"2023-07-27T09:18:03","modified_gmt":"2023-07-27T09:18:03","slug":"selecao-por-etapas","status":"publish","type":"post","link":"https:\/\/statorials.org\/pt\/selecao-por-etapas\/","title":{"rendered":"O que \u00e9 sele\u00e7\u00e3o faseada? (explica\u00e7\u00e3o e exemplos)"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\">No campo do aprendizado de m\u00e1quina, nosso objetivo \u00e9 criar um modelo que possa usar efetivamente um conjunto de vari\u00e1veis preditoras para prever o valor de uma <a href=\"https:\/\/statorials.org\/pt\/respostas-explicativas-das-variaveis\/\" target=\"_blank\" rel=\"noopener noreferrer\">vari\u00e1vel de resposta<\/a> .<\/span><\/p>\n<p> <span style=\"color: #000000;\">Dado um conjunto de <em>p<\/em> vari\u00e1veis preditoras totais, existem muitos modelos que poder\u00edamos construir.<\/span> <span style=\"color: #000000;\">Um m\u00e9todo que podemos usar para selecionar o melhor modelo \u00e9 conhecido como <a href=\"https:\/\/statorials.org\/pt\/melhor-selecao-de-subconjuntos\/\" target=\"_blank\" rel=\"noopener noreferrer\">melhor sele\u00e7\u00e3o de subconjunto<\/a> , que tenta escolher o melhor modelo dentre <em>todos<\/em> os modelos poss\u00edveis que poderiam ser constru\u00eddos com o conjunto de preditores.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Infelizmente, este m\u00e9todo apresenta duas desvantagens:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Isso pode ser computacionalmente intenso. Para um conjunto de <em>p<\/em> vari\u00e1veis preditoras, existem 2 <sup>p<\/sup> modelos poss\u00edveis. Por exemplo, com 10 vari\u00e1veis preditoras, existem 2 <sup>10<\/sup> = 1.000 modelos poss\u00edveis a serem considerados.<\/span><\/li>\n<li> <span style=\"color: #000000;\">Por considerar um n\u00famero muito grande de modelos, ele poderia potencialmente encontrar um modelo com bom desempenho em dados de treinamento, mas n\u00e3o em dados futuros. Isso pode levar <a href=\"https:\/\/statorials.org\/pt\/overfitting-de-aprendizado-de-maquina\/\" target=\"_blank\" rel=\"noopener noreferrer\">a um overfitting<\/a> .<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Uma alternativa para selecionar o melhor subconjunto \u00e9 conhecida como <strong>sele\u00e7\u00e3o stepwise<\/strong> , que compara um conjunto muito menor de modelos.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Existem dois tipos de m\u00e9todos de sele\u00e7\u00e3o de etapas: sele\u00e7\u00e3o de etapas para frente e sele\u00e7\u00e3o de etapas para tr\u00e1s.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Sele\u00e7\u00e3o passo a passo<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">A sele\u00e7\u00e3o passo a passo funciona da seguinte maneira:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>1.<\/strong> Seja M <sub>0<\/sub> o modelo nulo, que n\u00e3o cont\u00e9m nenhuma vari\u00e1vel preditiva.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>2.<\/strong> Para k = 0, 2,\u2026 p-1:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Ajuste todos os modelos pk que aumentam os preditores em M <sub>k<\/sub> com uma vari\u00e1vel preditora adicional.<\/span><\/li>\n<li> <span style=\"color: #000000;\">Escolha o melhor entre esses modelos pk e chame-o de M <sub>k+1<\/sub> . Defina \u201cmelhor\u201d como o modelo com o maior R <sup>2<\/sup> ou, equivalentemente, o menor RSS.<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\"><strong>3.<\/strong> Selecione um \u00fanico melhor modelo de M <sub>0<\/sub> \u2026 M <sub>p<\/sub> usando erro de predi\u00e7\u00e3o de valida\u00e7\u00e3o cruzada, Cp, BIC, AIC ou R <sup>2<\/sup> ajustado.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Sele\u00e7\u00e3o retroativa passo a passo<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">A sele\u00e7\u00e3o de etapas para tr\u00e1s funciona da seguinte maneira:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>1.<\/strong> Seja M <sub>p<\/sub> o modelo completo, que cont\u00e9m todas as <em>p<\/em> vari\u00e1veis preditivas.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>2.<\/strong> Para k = p, p-1,\u2026 1:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Ajuste todos os k modelos que cont\u00eam todos, exceto um preditor em <sub>Mk<\/sub> , para um total de k-1 vari\u00e1veis preditoras.<\/span><\/li>\n<li> <span style=\"color: #000000;\">Escolha o melhor entre esses k modelos e chame-o de M <sub>k-1<\/sub> . Defina \u201cmelhor\u201d como o modelo com o maior R <sup>2<\/sup> ou, equivalentemente, o menor RSS.<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\"><strong>3.<\/strong> Selecione um \u00fanico melhor modelo de M <sub>0<\/sub> \u2026 M <sub>p<\/sub> usando erro de predi\u00e7\u00e3o de valida\u00e7\u00e3o cruzada, Cp, BIC, AIC ou R <sup>2<\/sup> ajustado.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Crit\u00e9rios para escolher o \u201cmelhor\u201d modelo<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">A etapa final da sele\u00e7\u00e3o gradual para frente e para tr\u00e1s \u00e9 escolher o modelo com o menor erro de predi\u00e7\u00e3o, o menor Cp, o menor BIC, o maior AIC baixo ou o maior R <sup>2<\/sup> ajustado.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Aqui est\u00e3o as f\u00f3rmulas usadas para calcular cada uma dessas m\u00e9tricas:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Cp:<\/strong> (RSS+2d\u03c3\u0302) \/n<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>AIC:<\/strong> (RSS+2d\u03c3\u0302 <sup>2<\/sup> ) \/ (n\u03c3\u0302 <sup>2<\/sup> )<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>BIC:<\/strong> (RSS+log(n)d\u03c3\u0302 <sup>2<\/sup> ) \/ n<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>R <sup>2<\/sup> ajustado:<\/strong> 1 \u2013 ( (RSS \/ (nd-1)) \/ (TSS \/ (n-1)) )<\/span><\/p>\n<p> <span style=\"color: #000000;\">Ouro:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\"><strong>d:<\/strong> O n\u00famero de preditores<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>n:<\/strong> Total de observa\u00e7\u00f5es<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>\u03c3\u0302:<\/strong> Estimativa da vari\u00e2ncia do erro associada a cada medida de resposta em um modelo de regress\u00e3o<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>RSS:<\/strong> Soma residual dos quadrados do modelo de regress\u00e3o<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>TSS:<\/strong> Soma total dos quadrados do modelo de regress\u00e3o<\/span><\/li>\n<\/ul>\n<h3> <span style=\"color: #000000;\"><strong>Vantagens e desvantagens da sele\u00e7\u00e3o faseada<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">A sele\u00e7\u00e3o faseada oferece as seguintes <strong>vantagens<\/strong> :<\/span><\/p>\n<p> <span style=\"color: #000000;\">Este m\u00e9todo \u00e9 mais eficiente computacionalmente do que selecionar o melhor subconjunto. Dadas <em>p<\/em> vari\u00e1veis preditoras, a sele\u00e7\u00e3o do melhor subconjunto deve corresponder a 2 <sup>p<\/sup> modelos.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Por outro lado, a sele\u00e7\u00e3o passo a passo deve caber apenas nos modelos 1+p(p+ 1)\/2. Para p = 10 vari\u00e1veis preditoras, a sele\u00e7\u00e3o do melhor subconjunto deve caber em 1.000 modelos, enquanto a sele\u00e7\u00e3o passo a passo deve caber apenas em 56 modelos.<\/span><\/p>\n<p> <span style=\"color: #000000;\">No entanto, a sele\u00e7\u00e3o faseada tem a <strong>seguinte desvantagem potencial:<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">N\u00e3o \u00e9 garantido encontrar o melhor modelo poss\u00edvel entre todos os modelos <sup>2p<\/sup> potenciais.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Por exemplo, suponha que temos um conjunto de dados com p = 3 preditores. O melhor modelo poss\u00edvel de um preditor pode conter x <sub>1<\/sub> e o melhor modelo poss\u00edvel de dois preditores pode conter x <sub>1<\/sub> e x <sub>2<\/sub> .<\/span><\/p>\n<p> <span style=\"color: #000000;\">Nesse caso, a sele\u00e7\u00e3o gradual progressiva n\u00e3o conseguir\u00e1 selecionar o melhor modelo poss\u00edvel de dois preditores porque M <sub>1<\/sub> conter\u00e1 x <sub>1<\/sub> , ent\u00e3o M <sub>2<\/sub> tamb\u00e9m deve conter x <sub>1<\/sub> , bem como outra vari\u00e1vel.<\/span><\/p>\n","protected":false},"excerpt":{"rendered":"<p>No campo do aprendizado de m\u00e1quina, nosso objetivo \u00e9 criar um modelo que possa usar efetivamente um conjunto de vari\u00e1veis preditoras para prever o valor de uma vari\u00e1vel de resposta . Dado um conjunto de p vari\u00e1veis preditoras totais, existem muitos modelos que poder\u00edamos construir. Um m\u00e9todo que podemos usar para selecionar o melhor modelo [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"class_list":["post-1181","post","type-post","status-publish","format-standard","hentry","category-guia"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>O que \u00e9 sele\u00e7\u00e3o faseada? (Explica\u00e7\u00e3o e exemplos)<\/title>\n<meta name=\"description\" content=\"Este tutorial fornece uma explica\u00e7\u00e3o passo a passo da sele\u00e7\u00e3o do modelo com um exemplo.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/pt\/selecao-por-etapas\/\" \/>\n<meta property=\"og:locale\" content=\"pt_PT\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"O que \u00e9 sele\u00e7\u00e3o faseada? (Explica\u00e7\u00e3o e exemplos)\" \/>\n<meta property=\"og:description\" content=\"Este tutorial fornece uma explica\u00e7\u00e3o passo a passo da sele\u00e7\u00e3o do modelo com um exemplo.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/pt\/selecao-por-etapas\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-27T09:18:03+00:00\" \/>\n<meta name=\"author\" content=\"Dr. benjamim anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Escrito por\" \/>\n\t<meta name=\"twitter:data1\" content=\"Dr. benjamim anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Tempo estimado de leitura\" \/>\n\t<meta name=\"twitter:data2\" content=\"4 minutos\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/pt\/selecao-por-etapas\/\",\"url\":\"https:\/\/statorials.org\/pt\/selecao-por-etapas\/\",\"name\":\"O que \u00e9 sele\u00e7\u00e3o faseada? (Explica\u00e7\u00e3o e exemplos)\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/pt\/#website\"},\"datePublished\":\"2023-07-27T09:18:03+00:00\",\"dateModified\":\"2023-07-27T09:18:03+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/pt\/#\/schema\/person\/e08f98e8db95e0aa9c310e1b27c9c666\"},\"description\":\"Este tutorial fornece uma explica\u00e7\u00e3o passo a passo da sele\u00e7\u00e3o do modelo com um exemplo.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/pt\/selecao-por-etapas\/#breadcrumb\"},\"inLanguage\":\"pt-PT\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/pt\/selecao-por-etapas\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/pt\/selecao-por-etapas\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Lar\",\"item\":\"https:\/\/statorials.org\/pt\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"O que \u00e9 sele\u00e7\u00e3o faseada? (explica\u00e7\u00e3o e exemplos)\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/pt\/#website\",\"url\":\"https:\/\/statorials.org\/pt\/\",\"name\":\"Statorials\",\"description\":\"O seu guia para a literacia estat\u00edstica!\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/pt\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"pt-PT\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/pt\/#\/schema\/person\/e08f98e8db95e0aa9c310e1b27c9c666\",\"name\":\"Dr. benjamim anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"pt-PT\",\"@id\":\"https:\/\/statorials.org\/pt\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/statorials.org\/pt\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"https:\/\/statorials.org\/pt\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"caption\":\"Dr. benjamim anderson\"},\"description\":\"Ol\u00e1, sou Benjamin, um professor aposentado de estat\u00edstica que se tornou professor dedicado na Statorials. Com vasta experi\u00eancia e conhecimento na \u00e1rea de estat\u00edstica, estou empenhado em compartilhar meu conhecimento para capacitar os alunos por meio de Statorials. Saber mais\",\"sameAs\":[\"https:\/\/statorials.org\/pt\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"O que \u00e9 sele\u00e7\u00e3o faseada? (Explica\u00e7\u00e3o e exemplos)","description":"Este tutorial fornece uma explica\u00e7\u00e3o passo a passo da sele\u00e7\u00e3o do modelo com um exemplo.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/pt\/selecao-por-etapas\/","og_locale":"pt_PT","og_type":"article","og_title":"O que \u00e9 sele\u00e7\u00e3o faseada? (Explica\u00e7\u00e3o e exemplos)","og_description":"Este tutorial fornece uma explica\u00e7\u00e3o passo a passo da sele\u00e7\u00e3o do modelo com um exemplo.","og_url":"https:\/\/statorials.org\/pt\/selecao-por-etapas\/","og_site_name":"Statorials","article_published_time":"2023-07-27T09:18:03+00:00","author":"Dr. benjamim anderson","twitter_card":"summary_large_image","twitter_misc":{"Escrito por":"Dr. benjamim anderson","Tempo estimado de leitura":"4 minutos"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/pt\/selecao-por-etapas\/","url":"https:\/\/statorials.org\/pt\/selecao-por-etapas\/","name":"O que \u00e9 sele\u00e7\u00e3o faseada? (Explica\u00e7\u00e3o e exemplos)","isPartOf":{"@id":"https:\/\/statorials.org\/pt\/#website"},"datePublished":"2023-07-27T09:18:03+00:00","dateModified":"2023-07-27T09:18:03+00:00","author":{"@id":"https:\/\/statorials.org\/pt\/#\/schema\/person\/e08f98e8db95e0aa9c310e1b27c9c666"},"description":"Este tutorial fornece uma explica\u00e7\u00e3o passo a passo da sele\u00e7\u00e3o do modelo com um exemplo.","breadcrumb":{"@id":"https:\/\/statorials.org\/pt\/selecao-por-etapas\/#breadcrumb"},"inLanguage":"pt-PT","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/pt\/selecao-por-etapas\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/pt\/selecao-por-etapas\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Lar","item":"https:\/\/statorials.org\/pt\/"},{"@type":"ListItem","position":2,"name":"O que \u00e9 sele\u00e7\u00e3o faseada? (explica\u00e7\u00e3o e exemplos)"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/pt\/#website","url":"https:\/\/statorials.org\/pt\/","name":"Statorials","description":"O seu guia para a literacia estat\u00edstica!","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/pt\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"pt-PT"},{"@type":"Person","@id":"https:\/\/statorials.org\/pt\/#\/schema\/person\/e08f98e8db95e0aa9c310e1b27c9c666","name":"Dr. benjamim anderson","image":{"@type":"ImageObject","inLanguage":"pt-PT","@id":"https:\/\/statorials.org\/pt\/#\/schema\/person\/image\/","url":"https:\/\/statorials.org\/pt\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","contentUrl":"https:\/\/statorials.org\/pt\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","caption":"Dr. benjamim anderson"},"description":"Ol\u00e1, sou Benjamin, um professor aposentado de estat\u00edstica que se tornou professor dedicado na Statorials. Com vasta experi\u00eancia e conhecimento na \u00e1rea de estat\u00edstica, estou empenhado em compartilhar meu conhecimento para capacitar os alunos por meio de Statorials. Saber mais","sameAs":["https:\/\/statorials.org\/pt"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/pt\/wp-json\/wp\/v2\/posts\/1181","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/statorials.org\/pt\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/pt\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/pt\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/pt\/wp-json\/wp\/v2\/comments?post=1181"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/pt\/wp-json\/wp\/v2\/posts\/1181\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/pt\/wp-json\/wp\/v2\/media?parent=1181"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/pt\/wp-json\/wp\/v2\/categories?post=1181"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/pt\/wp-json\/wp\/v2\/tags?post=1181"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}