{"id":987,"date":"2023-07-28T02:09:42","date_gmt":"2023-07-28T02:09:42","guid":{"rendered":"https:\/\/statorials.org\/pt\/amostragem-estratificada-de-pandas\/"},"modified":"2023-07-28T02:09:42","modified_gmt":"2023-07-28T02:09:42","slug":"amostragem-estratificada-de-pandas","status":"publish","type":"post","link":"https:\/\/statorials.org\/pt\/amostragem-estratificada-de-pandas\/","title":{"rendered":"Amostragem estratificada em pandas (com exemplos)"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\">Os pesquisadores geralmente coletam <a href=\"https:\/\/statorials.org\/pt\/metodos-de-amostragem\/\" target=\"_blank\" rel=\"noopener noreferrer\">amostras<\/a> de uma popula\u00e7\u00e3o e usam os dados da amostra para tirar conclus\u00f5es sobre a popula\u00e7\u00e3o como um todo.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Um m\u00e9todo de amostragem comumente utilizado \u00e9 <strong>a amostragem aleat\u00f3ria estratificada<\/strong> , na qual uma popula\u00e7\u00e3o \u00e9 dividida em grupos e um certo n\u00famero de membros de cada grupo s\u00e3o selecionados aleatoriamente para inclus\u00e3o na amostra.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Este tutorial explica dois m\u00e9todos para realizar amostragem aleat\u00f3ria estratificada em Python.<\/span><\/p>\n<h3> <strong>Exemplo 1: Amostragem estratificada usando contagens<\/strong><\/h3>\n<p> <span style=\"color: #000000;\">Suponha que temos o seguinte DataFrame do pandas que cont\u00e9m dados de 8 jogadores de basquete de 2 times diferentes:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #107d3f;\">import<\/span> pandas <span style=\"color: #107d3f;\">as<\/span> pd\n\n<span style=\"color: #008080;\">#createDataFrame<\/span>\ndf = pd.DataFrame({'team': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],\n                   'position': ['G', 'G', 'F', 'G', 'F', 'F', 'C', 'C'],\n                   'assists': [5, 7, 7, 8, 5, 7, 6, 9],\n                   'rebounds': [11, 8, 10, 6, 6, 9, 6, 10]})\n\n<span style=\"color: #008080;\">#view DataFrame\n<\/span>df\n\n        team position assists rebounds\n0 A G 5 11\n1 A G 7 8\n2 A F 7 10\n3 A G 8 6\n4 B F 5 6\n5 B F 7 9\n6 B C 6 6\n7 B C 9 10\n<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">O c\u00f3digo a seguir mostra como realizar uma amostragem aleat\u00f3ria estratificada selecionando aleatoriamente 2 jogadores de cada equipe para incluir na amostra:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong>df. <span style=\"color: #3366ff;\">groupby<\/span> ('team', group_keys= <span style=\"color: #008000;\">False<\/span> ). <span style=\"color: #3366ff;\">apply<\/span> ( <span style=\"color: #008000;\">lambda<\/span> x: <span style=\"color: #3366ff;\">x.sample<\/span> (2))\n\n        team position assists rebounds\n0 A G 5 11\n3 A G 8 6\n6 B C 6 6\n5 B F 7 9\n<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Observe que dois jogadores de cada equipe est\u00e3o inclu\u00eddos na amostra estratificada.<\/span><\/p>\n<h3> <strong>Exemplo 2: Amostragem Estratificada Usando Propor\u00e7\u00f5es<\/strong><\/h3>\n<p> <span style=\"color: #000000;\">Vamos supor novamente que temos o seguinte DataFrame do pandas que cont\u00e9m dados de 8 jogadores de basquete de 2 times diferentes:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #107d3f;\">import<\/span> pandas <span style=\"color: #107d3f;\">as<\/span> pd\n\n<span style=\"color: #008080;\">#createDataFrame<\/span>\ndf = pd.DataFrame({'team': ['A', 'A', 'B', 'B', 'B', 'B', 'B', 'B'],\n                   'position': ['G', 'G', 'F', 'G', 'F', 'F', 'C', 'C'],\n                   'assists': [5, 7, 7, 8, 5, 7, 6, 9],\n                   'rebounds': [11, 8, 10, 6, 6, 9, 6, 10]})\n\n<span style=\"color: #008080;\">#view DataFrame\n<\/span>df\n\n        team position assists rebounds\n0 A G 5 11\n1 A G 7 8\n2 A F 7 10\n3 A G 8 6\n4 B F 5 6\n5 B F 7 9\n6 B C 6 6\n7 B C 9 10\n<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Observe que 6 dos 8 jogadores (75%) no DataFrame est\u00e3o no Time A e 2 dos 8 jogadores (25%) est\u00e3o no Time B.<\/span><\/p>\n<p> <span style=\"color: #000000;\">O c\u00f3digo a seguir mostra como realizar uma amostragem aleat\u00f3ria estratificada de modo que a propor\u00e7\u00e3o de jogadores na amostra de cada equipe corresponda \u00e0 propor\u00e7\u00e3o de jogadores de cada equipe no DataFrame maior:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008000;\">import<\/span> numpy as <span style=\"color: #008000;\">np\n\n<\/span><span style=\"color: #008080;\">#define total sample size desired<\/span>\nN = 4\n\n<span style=\"color: #008080;\">#perform stratified random sampling<\/span>\ndf. <span style=\"color: #3366ff;\">groupby<\/span> ('team', group_keys= <span style=\"color: #008000;\">False<\/span> ). <span style=\"color: #3366ff;\">apply<\/span> ( <span style=\"color: #008000;\">lambda<\/span> x: x. <span style=\"color: #3366ff;\">sample<\/span> (int(np. <span style=\"color: #3366ff;\">rint<\/span> (N* <span style=\"color: #3366ff;\">len<\/span> (x)\/ <span style=\"color: #3366ff;\">len<\/span> (df))))). <span style=\"color: #3366ff;\">sample<\/span> (frac=1). <span style=\"color: #3366ff;\">reset_index<\/span> (drop= <span style=\"color: #008000;\">True<\/span> )\n\n        team position assists rebounds\n0 B F 7 9\n1 B G 8 6\n2 B C 6 6\n3 A G 7 8\n<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Observe que a propor\u00e7\u00e3o de jogadores do Time A na amostra estratificada (25%) corresponde \u00e0 propor\u00e7\u00e3o de jogadores do Time A no DataFrame maior.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Da mesma forma, a propor\u00e7\u00e3o de jogadores do Time B na amostra estratificada (75%) corresponde \u00e0 propor\u00e7\u00e3o de jogadores do Time B no DataFrame maior.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Recursos adicionais<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Os tutoriais a seguir explicam como selecionar outros tipos de amostra usando pandas:<\/span><\/p>\n<p> <a href=\"https:\/\/statorials.org\/pt\/amostragem-por-conglomerados-em-pandas\/\" target=\"_blank\" rel=\"noopener noreferrer\">Como realizar amostragem por cluster no Pandas<\/a><br \/> <a href=\"https:\/\/statorials.org\/pt\/amostragem-sistematica-de-pandas\/\" target=\"_blank\" rel=\"noopener\">Como realizar amostragem sistem\u00e1tica entre pandas<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Os pesquisadores geralmente coletam amostras de uma popula\u00e7\u00e3o e usam os dados da amostra para tirar conclus\u00f5es sobre a popula\u00e7\u00e3o como um todo. Um m\u00e9todo de amostragem comumente utilizado \u00e9 a amostragem aleat\u00f3ria estratificada , na qual uma popula\u00e7\u00e3o \u00e9 dividida em grupos e um certo n\u00famero de membros de cada grupo s\u00e3o selecionados aleatoriamente [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"class_list":["post-987","post","type-post","status-publish","format-standard","hentry","category-guia"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Amostragem estratificada em pandas (com exemplos) - Estatologia<\/title>\n<meta name=\"description\" content=\"Uma explica\u00e7\u00e3o simples de como conduzir amostragem estratificada em pandas, incluindo v\u00e1rios exemplos.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/pt\/amostragem-estratificada-de-pandas\/\" \/>\n<meta property=\"og:locale\" content=\"pt_PT\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Amostragem estratificada em pandas (com exemplos) - Estatologia\" \/>\n<meta property=\"og:description\" content=\"Uma explica\u00e7\u00e3o simples de como conduzir amostragem estratificada em pandas, incluindo v\u00e1rios exemplos.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/pt\/amostragem-estratificada-de-pandas\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-28T02:09:42+00:00\" \/>\n<meta name=\"author\" content=\"Dr. benjamim anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Escrito por\" \/>\n\t<meta name=\"twitter:data1\" content=\"Dr. benjamim anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Tempo estimado de leitura\" \/>\n\t<meta name=\"twitter:data2\" content=\"2 minutos\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/pt\/amostragem-estratificada-de-pandas\/\",\"url\":\"https:\/\/statorials.org\/pt\/amostragem-estratificada-de-pandas\/\",\"name\":\"Amostragem estratificada em pandas (com exemplos) - Estatologia\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/pt\/#website\"},\"datePublished\":\"2023-07-28T02:09:42+00:00\",\"dateModified\":\"2023-07-28T02:09:42+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/pt\/#\/schema\/person\/e08f98e8db95e0aa9c310e1b27c9c666\"},\"description\":\"Uma explica\u00e7\u00e3o simples de como conduzir amostragem estratificada em pandas, incluindo v\u00e1rios exemplos.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/pt\/amostragem-estratificada-de-pandas\/#breadcrumb\"},\"inLanguage\":\"pt-PT\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/pt\/amostragem-estratificada-de-pandas\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/pt\/amostragem-estratificada-de-pandas\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Lar\",\"item\":\"https:\/\/statorials.org\/pt\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Amostragem estratificada em pandas (com exemplos)\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/pt\/#website\",\"url\":\"https:\/\/statorials.org\/pt\/\",\"name\":\"Statorials\",\"description\":\"O seu guia para a literacia estat\u00edstica!\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/pt\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"pt-PT\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/pt\/#\/schema\/person\/e08f98e8db95e0aa9c310e1b27c9c666\",\"name\":\"Dr. benjamim anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"pt-PT\",\"@id\":\"https:\/\/statorials.org\/pt\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/statorials.org\/pt\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"https:\/\/statorials.org\/pt\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"caption\":\"Dr. benjamim anderson\"},\"description\":\"Ol\u00e1, sou Benjamin, um professor aposentado de estat\u00edstica que se tornou professor dedicado na Statorials. Com vasta experi\u00eancia e conhecimento na \u00e1rea de estat\u00edstica, estou empenhado em compartilhar meu conhecimento para capacitar os alunos por meio de Statorials. Saber mais\",\"sameAs\":[\"https:\/\/statorials.org\/pt\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Amostragem estratificada em pandas (com exemplos) - Estatologia","description":"Uma explica\u00e7\u00e3o simples de como conduzir amostragem estratificada em pandas, incluindo v\u00e1rios exemplos.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/pt\/amostragem-estratificada-de-pandas\/","og_locale":"pt_PT","og_type":"article","og_title":"Amostragem estratificada em pandas (com exemplos) - Estatologia","og_description":"Uma explica\u00e7\u00e3o simples de como conduzir amostragem estratificada em pandas, incluindo v\u00e1rios exemplos.","og_url":"https:\/\/statorials.org\/pt\/amostragem-estratificada-de-pandas\/","og_site_name":"Statorials","article_published_time":"2023-07-28T02:09:42+00:00","author":"Dr. benjamim anderson","twitter_card":"summary_large_image","twitter_misc":{"Escrito por":"Dr. benjamim anderson","Tempo estimado de leitura":"2 minutos"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/pt\/amostragem-estratificada-de-pandas\/","url":"https:\/\/statorials.org\/pt\/amostragem-estratificada-de-pandas\/","name":"Amostragem estratificada em pandas (com exemplos) - Estatologia","isPartOf":{"@id":"https:\/\/statorials.org\/pt\/#website"},"datePublished":"2023-07-28T02:09:42+00:00","dateModified":"2023-07-28T02:09:42+00:00","author":{"@id":"https:\/\/statorials.org\/pt\/#\/schema\/person\/e08f98e8db95e0aa9c310e1b27c9c666"},"description":"Uma explica\u00e7\u00e3o simples de como conduzir amostragem estratificada em pandas, incluindo v\u00e1rios exemplos.","breadcrumb":{"@id":"https:\/\/statorials.org\/pt\/amostragem-estratificada-de-pandas\/#breadcrumb"},"inLanguage":"pt-PT","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/pt\/amostragem-estratificada-de-pandas\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/pt\/amostragem-estratificada-de-pandas\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Lar","item":"https:\/\/statorials.org\/pt\/"},{"@type":"ListItem","position":2,"name":"Amostragem estratificada em pandas (com exemplos)"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/pt\/#website","url":"https:\/\/statorials.org\/pt\/","name":"Statorials","description":"O seu guia para a literacia estat\u00edstica!","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/pt\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"pt-PT"},{"@type":"Person","@id":"https:\/\/statorials.org\/pt\/#\/schema\/person\/e08f98e8db95e0aa9c310e1b27c9c666","name":"Dr. benjamim anderson","image":{"@type":"ImageObject","inLanguage":"pt-PT","@id":"https:\/\/statorials.org\/pt\/#\/schema\/person\/image\/","url":"https:\/\/statorials.org\/pt\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","contentUrl":"https:\/\/statorials.org\/pt\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","caption":"Dr. benjamim anderson"},"description":"Ol\u00e1, sou Benjamin, um professor aposentado de estat\u00edstica que se tornou professor dedicado na Statorials. Com vasta experi\u00eancia e conhecimento na \u00e1rea de estat\u00edstica, estou empenhado em compartilhar meu conhecimento para capacitar os alunos por meio de Statorials. Saber mais","sameAs":["https:\/\/statorials.org\/pt"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/pt\/wp-json\/wp\/v2\/posts\/987","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/statorials.org\/pt\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/pt\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/pt\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/pt\/wp-json\/wp\/v2\/comments?post=987"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/pt\/wp-json\/wp\/v2\/posts\/987\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/pt\/wp-json\/wp\/v2\/media?parent=987"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/pt\/wp-json\/wp\/v2\/categories?post=987"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/pt\/wp-json\/wp\/v2\/tags?post=987"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}