Vantagens e desvantagens de usar média em estatísticas


A média de um conjunto de dados representa o valor médio do conjunto de dados.

É calculado da seguinte forma:

Média = Σx i / n

Ouro:

  • Σ: Um símbolo que significa “soma”
  • x i : A i -ésima observação em um conjunto de dados
  • n: o número total de observações no conjunto de dados

Existem duas vantagens principais em usar a média para descrever o “centro” ou “média” de um conjunto de dados:

Vantagem nº 1: A média usa todas as observações de um conjunto de dados em seu cálculo. Nas estatísticas, isso geralmente é bom porque se diz que utiliza todas as informações disponíveis em um conjunto de dados.

Vantagem nº 2: A média é fácil de calcular e interpretar. A média é a soma de todas as observações dividida pelo número total de observações. É fácil de calcular (mesmo manualmente) e fácil de interpretar.

No entanto, usar a média para resumir um conjunto de dados tem duas desvantagens potenciais:

Desvantagem nº 1: a média é afetada por valores discrepantes. Se um conjunto de dados tiver um valor atípico extremo, isso afetará a média e o tornará uma medida não confiável do centro de um conjunto de dados.

Desvantagem nº 2: a média pode ser enganosa com conjuntos de dados distorcidos. Quando um conjunto de dados é inclinado para a esquerda ou para a direita , a média pode ser uma forma enganosa de medir o centro de um conjunto de dados.

Os exemplos a seguir ilustram essas vantagens e desvantagens na prática.

Exemplo 1: Os benefícios de usar a média

Suponha que temos o seguinte histograma que mostra os salários dos residentes de uma determinada cidade:

Como esta distribuição é geralmente simétrica (se você a dividir ao meio, cada metade pareceria aproximadamente igual) e não há valores discrepantes, a média é uma forma útil de descrever o centro deste conjunto de dados.

A média acaba sendo de US$ 63.000, que está aproximadamente no centro da distribuição:

Neste exemplo específico, conseguimos usar as duas vantagens da média:

Vantagem nº 1: A média usa todas as observações de um conjunto de dados em seu cálculo.

Como a distribuição era essencialmente simétrica e não havia valores extremos, pudemos usar todos os salários disponíveis para calcular a média, o que nos deu uma boa ideia do salário “médio” ou “típico” nesta cidade em particular.

Vantagem nº 2: A média é fácil de calcular e interpretar. É fácil entender que o salário médio de US$ 63 mil representa o salário “médio” de um indivíduo nesta cidade.

Embora alguns indivíduos ganhem muito mais que isso e outros muito menos, esse valor médio nos dá uma boa ideia de um salário “típico” nesta cidade.

Exemplo 2: As desvantagens de usar a média

Suponha que temos uma distribuição salarial muito distorcida e decidimos calcular o salário médio e mediano:

Valores mais altos na cauda da distribuição afastam a média do centro e em direção à cauda longa.

Neste exemplo, a média nos diz que um indivíduo típico ganha cerca de US$ 47.000 por ano, enquanto a mediana nos diz que o indivíduo típico ganha apenas cerca de US$ 32.000 por ano, o que é muito mais representativo do indivíduo típico.

Neste exemplo, a média resume mal o valor “típico” ou “médio” nesta distribuição, uma vez que a distribuição é distorcida.

Ou suponha que temos outra distribuição contendo informações sobre a metragem quadrada das casas em uma determinada rua e decidimos calcular a média e a mediana do conjunto de dados:

Quando usar a média versus a mediana

A média é influenciada por algumas casas extremamente grandes, fazendo com que ela assuma um valor muito mais elevado.

Isso torna o valor médio da metragem quadrada enganoso e fornece uma medida inadequada da metragem quadrada “típica” de uma casa naquela rua.

Recursos adicionais

Os tutoriais a seguir fornecem informações adicionais sobre a média e a mediana nas estatísticas:

Como os outliers afetam a média?
Como estimar a média e mediana de qualquer histograma
Como encontrar a média e a mediana dos gráficos de caule e folhas

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *