{"id":915,"date":"2023-07-28T08:02:55","date_gmt":"2023-07-28T08:02:55","guid":{"rendered":"https:\/\/statorials.org\/pt\/remover-valores-discrepantes-r\/"},"modified":"2023-07-28T08:02:55","modified_gmt":"2023-07-28T08:02:55","slug":"remover-valores-discrepantes-r","status":"publish","type":"post","link":"https:\/\/statorials.org\/pt\/remover-valores-discrepantes-r\/","title":{"rendered":"Como remover outliers em r"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\">Um <strong>outlier<\/strong> \u00e9 uma observa\u00e7\u00e3o anormalmente distante de outros valores em um conjunto de dados. Valores discrepantes podem ser problem\u00e1ticos porque podem afetar os resultados de uma an\u00e1lise.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Este tutorial explica como identificar e remover outliers em R.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Como identificar outliers em R<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Antes de remover valores discrepantes, voc\u00ea deve primeiro decidir o que considera ser um valor discrepante. Existem duas maneiras comuns de fazer isso:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>1. Use o intervalo interquartil.<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">O intervalo interquartil (IQR) \u00e9 a diferen\u00e7a entre o percentil 75 (Q3) e o percentil 25 (Q1) em um conjunto de dados. Mede a distribui\u00e7\u00e3o da m\u00e9dia de 50% dos valores.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Voc\u00ea pode definir uma observa\u00e7\u00e3o como discrepante se ela for 1,5 vezes o intervalo interquartil acima do terceiro quartil (Q3) ou 1,5 vezes o intervalo interquartil abaixo do primeiro quartil (Q1).<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Outliers = Observa\u00e7\u00f5es &gt; Q3 + 1,5*IQR ou &lt; Q1 \u2013 1,5*IQR<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>2. Use pontua\u00e7\u00f5es z.<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Uma <a href=\"https:\/\/statorials.org\/pt\/pontuacao-zr\/\" target=\"_blank\" rel=\"noopener noreferrer\">pontua\u00e7\u00e3o z<\/a> informa quantos desvios padr\u00e3o um determinado valor est\u00e1 da m\u00e9dia. Usamos a seguinte f\u00f3rmula para calcular uma pontua\u00e7\u00e3o z:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>z<\/strong> = (X \u2013 \u03bc) \/ \u03c3<\/span><\/p>\n<p> <span style=\"color: #000000;\">Ouro:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">X \u00e9 um \u00fanico valor de dados brutos<\/span><\/li>\n<li> <span style=\"color: #000000;\">\u03bc \u00e9 a m\u00e9dia da popula\u00e7\u00e3o<\/span><\/li>\n<li> <span style=\"color: #000000;\">\u03c3 \u00e9 o desvio padr\u00e3o da popula\u00e7\u00e3o<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Voc\u00ea pode definir uma observa\u00e7\u00e3o como discrepante se sua pontua\u00e7\u00e3o z for menor que -3 ou maior que 3.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Outliers = Observa\u00e7\u00f5es com pontua\u00e7\u00f5es z &gt; 3 ou &lt; -3<\/strong><\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Como remover outliers em R<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Depois de decidir o que voc\u00ea considera discrepante, voc\u00ea pode identific\u00e1-los e remov\u00ea-los de um conjunto de dados. Para ilustrar como fazer isso, usaremos o seguinte quadro de dados:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#make this example reproducible<\/span> \nset.seed(0)\n\n<span style=\"color: #008080;\">#create data frame with three columns A', 'B', 'C'<\/span> \ndf &lt;- data.frame(A=rnorm(1000, mean=10, sd=3),\n                 B=rnorm(1000, mean=20, sd=3),\n                 C=rnorm(1000, mean=30, sd=3))\n\n<span style=\"color: #008080;\">#view first six rows of data frame<\/span>\nhead(df)\n         ABC\n1 13.78886 19.13945 31.33304\n2 9.02130 25.52332 30.03579\n3 13.98940 19.52971 29.97216\n4 13.81729 15.83059 29.09287\n5 11.24392 15.58069 31.47707\n6 5.38015 19.79144 28.19184\n<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Podemos ent\u00e3o definir e remover valores discrepantes usando o m\u00e9todo z-score ou o m\u00e9todo do intervalo interquartil:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>M\u00e9todo de pontua\u00e7\u00e3o Z:<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">O c\u00f3digo a seguir mostra como calcular a pontua\u00e7\u00e3o z de cada valor em cada coluna do quadro de dados e, em seguida, remover as linhas que possuem pelo menos uma pontua\u00e7\u00e3o z com valor absoluto maior que 3:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#find absolute value of z-score for each value in each column<\/span>\nz_scores &lt;- <span style=\"color: #3366ff;\">as.data.frame<\/span> (sapply(df, function(df) (abs(df-mean(df))\/sd(df))))\n\n<span style=\"color: #008080;\">#view first six rows of z_scores data frame\n<\/span>head(z_scores)\n\n          ABC\n1 1.2813403 0.25350805 0.39419878\n2 0.3110243 1.80496734 0.05890232\n3 1.3483190 0.12766847 0.08112630\n4 1.2908343 1.32044506 0.38824414\n5 0.4313316 1.40102642 0.44450451\n6 1.5271674 0.04327186 0.70295309\n\n<span style=\"color: #008080;\">#only keep rows in dataframe with all z-scores less than absolute value of 3<\/span> \nno_outliers &lt;- z_scores[!rowSums(z_scores&gt;3), ]\n\n<span style=\"color: #008080;\">#view row and column count of new data frame<\/span>\ndim(no_outliers)\n\n[1] 994 3\n<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">O quadro de dados original tinha 1.000 linhas e 3 colunas. O novo quadro de dados possui 994 linhas e 3 colunas, o que nos indica que 6 linhas foram removidas porque tinham pelo menos um escore z com valor absoluto maior que 3 em uma de suas colunas.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>M\u00e9todo de intervalo interquartil:<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Em alguns casos, podemos querer identificar apenas valores discrepantes em uma coluna de um quadro de dados. Por exemplo, digamos que queremos apenas remover linhas com valores discrepantes na coluna \u201cA\u201d do nosso quadro de dados.<\/span><\/p>\n<p> <span style=\"color: #000000;\">O c\u00f3digo a seguir mostra como remover linhas do quadro de dados cujo valor na coluna &#8220;A&#8221; \u00e9 1,5 vezes o intervalo interquartil acima do terceiro quartil (Q3) ou 1,5 vezes o intervalo interquartil abaixo do primeiro quartil (Q1). .<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#find Q1, Q3, and interquartile range for values in column A<\/span>\nQ1 &lt;- quantile(df$A, .25)\nQ3 &lt;- quantile(df$A, .75)\nIQR &lt;- IQR(df$A)\n\n<span style=\"color: #008080;\">#only keep rows in dataframe that have values within 1.5*IQR of Q1 and Q3<\/span>\nno_outliers &lt;- subset(df, df$A&gt; (Q1 - 1.5*IQR) &amp; df$A&lt; (Q3 + 1.5*IQR))\n\n<span style=\"color: #008080;\">#view row and column count of new data frame\n<\/span>dim(no_outliers) \n\n[1] 994 3<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">O quadro de dados original tinha 1.000 linhas e 3 colunas. O novo quadro de dados tem 994 linhas e 3 colunas, o que nos indica que 6 linhas foram removidas porque continham pelo menos um valor discrepante na coluna A.<\/span><\/p>\n<h3> <strong>Quando remover valores discrepantes<\/strong><\/h3>\n<p> <span style=\"color: #000000;\">Se um ou mais valores discrepantes estiverem presentes, voc\u00ea dever\u00e1 primeiro verificar se eles n\u00e3o s\u00e3o resultado de um erro de entrada de dados. \u00c0s vezes, um indiv\u00edduo simplesmente insere o valor errado dos dados ao salvar os dados.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Se o valor discrepante for o resultado de um erro de entrada de dados, voc\u00ea pode decidir atribuir a ele um novo valor, como <a href=\"https:\/\/statorials.org\/pt\/mede-a-tendencia-central\/\" target=\"_blank\" rel=\"noopener noreferrer\">a m\u00e9dia ou mediana<\/a> do conjunto de dados.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Se o valor for realmente at\u00edpico, voc\u00ea poder\u00e1 optar por remov\u00ea-lo se ele tiver um impacto significativo em sua an\u00e1lise geral. Apenas certifique-se de mencionar em seu relat\u00f3rio ou an\u00e1lise final que voc\u00ea removeu um valor discrepante.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Recursos adicionais<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Neste tutorial, usamos <strong>rnorm()<\/strong> para gerar vetores de vari\u00e1veis aleat\u00f3rias normalmente distribu\u00eddas, dado um comprimento de vetor <em>n<\/em> , uma m\u00e9dia populacional <em>\u03bc<\/em> e um desvio padr\u00e3o populacional <em>\u03c3<\/em> . Voc\u00ea pode aprender mais sobre esse recurso <a href=\"https:\/\/statorials.org\/pt\/dnorm-pnorm-rnorm-qnorm-em-r\/\" target=\"_blank\" rel=\"noopener noreferrer\">aqui<\/a> .<\/span><\/p>\n<p> <span style=\"color: #000000;\">Tamb\u00e9m usamos <strong>sapply()<\/strong> para aplicar uma fun\u00e7\u00e3o a cada coluna em um quadro de dados que calculava pontua\u00e7\u00f5es z. Voc\u00ea pode aprender mais sobre esse recurso <a href=\"https:\/\/statorials.org\/pt\/um-guia-para-aplicar-lapply-sapply-e-tapply-em-r\/\" target=\"_blank\" rel=\"noopener noreferrer\">aqui<\/a> .<\/span><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Um outlier \u00e9 uma observa\u00e7\u00e3o anormalmente distante de outros valores em um conjunto de dados. Valores discrepantes podem ser problem\u00e1ticos porque podem afetar os resultados de uma an\u00e1lise. Este tutorial explica como identificar e remover outliers em R. Como identificar outliers em R Antes de remover valores discrepantes, voc\u00ea deve primeiro decidir o que considera [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"class_list":["post-915","post","type-post","status-publish","format-standard","hentry","category-guia"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Como remover outliers em R - Estatologia<\/title>\n<meta name=\"description\" content=\"Uma explica\u00e7\u00e3o simples de como remover outliers em R, incluindo v\u00e1rios exemplos.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/pt\/remover-valores-discrepantes-r\/\" \/>\n<meta property=\"og:locale\" content=\"pt_PT\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Como remover outliers em R - Estatologia\" \/>\n<meta property=\"og:description\" content=\"Uma explica\u00e7\u00e3o simples de como remover outliers em R, incluindo v\u00e1rios exemplos.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/pt\/remover-valores-discrepantes-r\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-28T08:02:55+00:00\" \/>\n<meta name=\"author\" content=\"Dr. benjamim anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Escrito por\" \/>\n\t<meta name=\"twitter:data1\" content=\"Dr. benjamim anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Tempo estimado de leitura\" \/>\n\t<meta name=\"twitter:data2\" content=\"4 minutos\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/pt\/remover-valores-discrepantes-r\/\",\"url\":\"https:\/\/statorials.org\/pt\/remover-valores-discrepantes-r\/\",\"name\":\"Como remover outliers em R - Estatologia\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/pt\/#website\"},\"datePublished\":\"2023-07-28T08:02:55+00:00\",\"dateModified\":\"2023-07-28T08:02:55+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/pt\/#\/schema\/person\/e08f98e8db95e0aa9c310e1b27c9c666\"},\"description\":\"Uma explica\u00e7\u00e3o simples de como remover outliers em R, incluindo v\u00e1rios exemplos.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/pt\/remover-valores-discrepantes-r\/#breadcrumb\"},\"inLanguage\":\"pt-PT\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/pt\/remover-valores-discrepantes-r\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/pt\/remover-valores-discrepantes-r\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Lar\",\"item\":\"https:\/\/statorials.org\/pt\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Como remover outliers em r\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/pt\/#website\",\"url\":\"https:\/\/statorials.org\/pt\/\",\"name\":\"Statorials\",\"description\":\"O seu guia para a literacia estat\u00edstica!\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/pt\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"pt-PT\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/pt\/#\/schema\/person\/e08f98e8db95e0aa9c310e1b27c9c666\",\"name\":\"Dr. benjamim anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"pt-PT\",\"@id\":\"https:\/\/statorials.org\/pt\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/statorials.org\/pt\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"https:\/\/statorials.org\/pt\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"caption\":\"Dr. benjamim anderson\"},\"description\":\"Ol\u00e1, sou Benjamin, um professor aposentado de estat\u00edstica que se tornou professor dedicado na Statorials. Com vasta experi\u00eancia e conhecimento na \u00e1rea de estat\u00edstica, estou empenhado em compartilhar meu conhecimento para capacitar os alunos por meio de Statorials. Saber mais\",\"sameAs\":[\"https:\/\/statorials.org\/pt\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Como remover outliers em R - Estatologia","description":"Uma explica\u00e7\u00e3o simples de como remover outliers em R, incluindo v\u00e1rios exemplos.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/pt\/remover-valores-discrepantes-r\/","og_locale":"pt_PT","og_type":"article","og_title":"Como remover outliers em R - Estatologia","og_description":"Uma explica\u00e7\u00e3o simples de como remover outliers em R, incluindo v\u00e1rios exemplos.","og_url":"https:\/\/statorials.org\/pt\/remover-valores-discrepantes-r\/","og_site_name":"Statorials","article_published_time":"2023-07-28T08:02:55+00:00","author":"Dr. benjamim anderson","twitter_card":"summary_large_image","twitter_misc":{"Escrito por":"Dr. benjamim anderson","Tempo estimado de leitura":"4 minutos"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/pt\/remover-valores-discrepantes-r\/","url":"https:\/\/statorials.org\/pt\/remover-valores-discrepantes-r\/","name":"Como remover outliers em R - Estatologia","isPartOf":{"@id":"https:\/\/statorials.org\/pt\/#website"},"datePublished":"2023-07-28T08:02:55+00:00","dateModified":"2023-07-28T08:02:55+00:00","author":{"@id":"https:\/\/statorials.org\/pt\/#\/schema\/person\/e08f98e8db95e0aa9c310e1b27c9c666"},"description":"Uma explica\u00e7\u00e3o simples de como remover outliers em R, incluindo v\u00e1rios exemplos.","breadcrumb":{"@id":"https:\/\/statorials.org\/pt\/remover-valores-discrepantes-r\/#breadcrumb"},"inLanguage":"pt-PT","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/pt\/remover-valores-discrepantes-r\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/pt\/remover-valores-discrepantes-r\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Lar","item":"https:\/\/statorials.org\/pt\/"},{"@type":"ListItem","position":2,"name":"Como remover outliers em r"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/pt\/#website","url":"https:\/\/statorials.org\/pt\/","name":"Statorials","description":"O seu guia para a literacia estat\u00edstica!","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/pt\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"pt-PT"},{"@type":"Person","@id":"https:\/\/statorials.org\/pt\/#\/schema\/person\/e08f98e8db95e0aa9c310e1b27c9c666","name":"Dr. benjamim anderson","image":{"@type":"ImageObject","inLanguage":"pt-PT","@id":"https:\/\/statorials.org\/pt\/#\/schema\/person\/image\/","url":"https:\/\/statorials.org\/pt\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","contentUrl":"https:\/\/statorials.org\/pt\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","caption":"Dr. benjamim anderson"},"description":"Ol\u00e1, sou Benjamin, um professor aposentado de estat\u00edstica que se tornou professor dedicado na Statorials. Com vasta experi\u00eancia e conhecimento na \u00e1rea de estat\u00edstica, estou empenhado em compartilhar meu conhecimento para capacitar os alunos por meio de Statorials. Saber mais","sameAs":["https:\/\/statorials.org\/pt"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/pt\/wp-json\/wp\/v2\/posts\/915","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/statorials.org\/pt\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/pt\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/pt\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/pt\/wp-json\/wp\/v2\/comments?post=915"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/pt\/wp-json\/wp\/v2\/posts\/915\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/pt\/wp-json\/wp\/v2\/media?parent=915"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/pt\/wp-json\/wp\/v2\/categories?post=915"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/pt\/wp-json\/wp\/v2\/tags?post=915"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}