Dados agrupados

Este artigo explica o que são dados agrupados e como os dados são agrupados. Além disso, você encontrará um exercício resolvido no qual os dados são agrupados por intervalos.

O que são dados agrupados?

Nas estatísticas, os dados armazenados são dados agrupados em intervalos. Em outras palavras, dados agrupados são dados coletados em intervalos regulares para que possam ser estudados em conjunto.

Assim, ao agrupar um conjunto de dados estatísticos, ele é separado em diferentes intervalos, de forma que cada dado só pode pertencer a um intervalo.

Resumindo, em estatística, o agrupamento de dados permite que vários dados sejam analisados em conjunto, de modo que os dados agrupados dentro de um intervalo sejam tratados como um único dado. Além disso, o pool de dados é muito útil quando a amostra é muito grande.

Exemplo de dados agrupados

Observando a definição de dados agrupados, abaixo está um exemplo concreto de como um conjunto de dados é agrupado em diferentes intervalos.

  • O tamanho da amostra de 50 pessoas diferentes foi medido e todos os valores foram registrados na tabela de dados a seguir. Agrupe o conjunto de dados em intervalos e, em seguida, represente graficamente os dados.

Primeiro, precisamos separar os dados em intervalos. Existem muitos métodos para isso, mas a regra de Sturges é a mais utilizada, pois permite calcular o número ideal de intervalos:

\begin{array}{l}c=1+\log_2(N)\\[2ex]c=1+\log_2(50)\\[2ex]c=1+5,64\\[2ex]c=6,64\\[2ex]c\approx 7\end{array}

Portanto, precisamos separar os dados em sete intervalos diferentes. Agora precisamos saber a largura que cada intervalo deve ter. Para fazer isso, basta dividir o valor máximo menos o valor mínimo pelo número total de intervalos:

a=\cfrac{\text{valor m\'aximo}-\text{valor m\'inimo}}{c}=\cfrac{205-145}{7}=8,57\approx 9

Resumindo, deve haver 7 intervalos de amplitude 9, então os intervalos calculados segundo a regra de Sturges são os seguintes:

[145,154)

[154,163)

[163,172)

[172,181)

[181,190)

[190,199)

[199,208)

E uma vez calculados os intervalos, contamos o número de vezes que um dado aparece em cada intervalo e construímos uma tabela com os dados agrupados:

Tenha em mente que ainda mais tipos de frequência podem ser calculados a partir de dados agrupados (frequência relativa, frequência cumulativa, etc.). Para ver como criar uma tabela de frequência completa com dados agrupados, clique aqui:

Por fim, a partir da tabela com a frequência de cada intervalo, podemos representar graficamente os dados agrupados em um histograma.

Histograma da regra de Sturges, estatísticas

Dados agrupados e desagrupados

Dados não agrupados são dados que não são separados em intervalos, mas cada valor é estudado separadamente.

Seguindo o exemplo trabalhado acima, se não tivéssemos agrupado os dados, teríamos que encontrar a frequência de cada valor. Ou seja, deveríamos ter calculado quantas vezes o valor 158, 165, 174, etc. é repetido. Porém, neste caso foi melhor agrupar os dados por intervalos porque tínhamos uma grande quantidade de dados e, além disso, muitos valores eram semelhantes.

Portanto, durante um estudo estatístico, antes de realizar os cálculos, é importante decidir se os dados devem ser agrupados por intervalos ou não, pois isso condicionará o restante da investigação.

Quando os dados devem ser consolidados?

Em geral, os dados devem ser agrupados em intervalos quando a variável é contínua. Se a variável for contínua, normalmente temos muitos valores e eles estão muito próximos entre si, portanto podem ser agrupados em intervalos para simplificar o estudo.

Logicamente, mesmo que a variável não seja contínua, se tivermos muitos dados, ela também pode ser agrupada em intervalos, facilitando a análise estatística. Mas geralmente o critério para agrupar os dados é o tipo de variável: se a variável for contínua, os dados geralmente são separados em intervalos.

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *