Gráfico de dispersão

Este artigo explica o que são gráficos de dispersão. Portanto, você descobrirá para que serve uma nuvem de pontos, como criar uma nuvem de pontos, como interpretá-la e exemplos de nuvens de pontos.

O que é uma nuvem de pontos?

Gráfico de dispersão , ou gráfico de dispersão , é um tipo de diagrama estatístico no qual um conjunto de dados de duas variáveis é representado graficamente em dois eixos de coordenadas cartesianas.

Portanto, gráficos de dispersão são usados para analisar a relação entre duas variáveis estatísticas.

Gráfico de dispersão

Os gráficos de dispersão têm vários nomes diferentes, como diagrama de correlação ou gráfico de dispersão .

Ressalta-se que o diagrama de dispersão é considerado uma das ferramentas básicas do controle de qualidade, assim como o gráfico de Pareto, o diagrama de causa e efeito, o fluxograma, etc.

Como fazer um gráfico de dispersão

Para criar um gráfico de dispersão, você precisa seguir as seguintes etapas:

  1. Colete dados estatísticos da amostra que deseja analisar. Tenha em mente que para criar um gráfico de dispersão, deve haver pelo menos duas variáveis quantitativas.
  2. Trace os dois eixos do gráfico de dispersão.
  3. Determine as duas variáveis estatísticas que serão representadas graficamente.
  4. Calibre a escala de cada eixo do gráfico. Para isso, recomenda-se primeiro encontrar o mínimo e o máximo de cada variável e, com base nesses valores, escalar cada eixo.
  5. Represente cada par de dados no gráfico de dispersão com um ponto.
  6. Analise e interprete o diagrama de dispersão obtido.

Exemplo de gráfico de dispersão

Depois de ver a definição de um diagrama de dispersão e a teoria sobre sua criação, esta seção apresenta um diagrama deste tipo como exemplo.

  • Na tabela de frequência a seguir, as pontuações em matemática e estatística de uma amostra de 20 alunos foram coletadas como dados. Plote o conjunto de dados em um gráfico de dispersão e analise-o.

Para representar a série de dados em um gráfico de dispersão, precisamos simplesmente traçar dois eixos, calibrá-los e traçar um ponto no gráfico para cada par de dados. Lembre-se que um ponto num gráfico é colocado na intersecção das linhas imaginárias correspondentes a cada um dos seus valores.

exemplo de nuvem de pontos

Cada eixo do gráfico de dispersão representa uma variável. Mais precisamente, o eixo horizontal pertence à nota obtida em matemática e, por outro lado, o eixo vertical corresponde à nota obtida em estatística.

Como você pode ver no gráfico de dispersão, as duas variáveis têm uma correlação positiva, porque uma variável aumenta à medida que a outra variável também aumenta. Portanto, conclui-se que se um aluno obtiver uma nota melhor em matemática, é mais provável que ele também obtenha uma nota melhor em estatística e vice-versa.

Porém, a conclusão anterior não significa que uma variável seja causa da outra, pois tirar uma boa nota em matemática não garante automaticamente uma boa nota em estatística sem fazer nada, mas sim deve-se estudar as duas disciplinas. Na próxima seção entraremos em mais detalhes sobre esse conceito.

O gráfico de dispersão e correlação

A partir de um diagrama de dispersão é possível identificar o tipo de correlação entre duas variáveis:

  • Correlação direta (ou correlação positiva) : uma variável aumenta quando a outra também aumenta.
  • Correlação inversa (ou correlação negativa) : quando uma variável aumenta, a outra diminui, e vice-versa, se uma variável diminui, a outra aumenta.
  • Correlação zero (Sem correlação) : Não há relação entre as duas variáveis.

Da mesma forma, quer a correlação entre as duas variáveis seja direta ou inversa, a correlação também pode ser classificada com base na força ou fraqueza da relação entre as duas variáveis.

  • Correlação forte: as duas variáveis estão intimamente ligadas. Os pontos são reunidos na nuvem de pontos. Isso torna mais fácil identificar a relação entre as variáveis.
  • Correlação baixa : Existe uma relação entre as duas variáveis, mas é difícil de identificar. Os pontos estão distantes um do outro na nuvem de pontos.
diagrama de dispersão e correlação entre duas variáveis

Por outro lado, a correlação também pode ser calculada numericamente por meio de uma fórmula, permitindo saber matematicamente o quão intimamente relacionadas estão duas variáveis diferentes. Para ver como funciona, clique no link a seguir:

Tenha em mente que mesmo que exista uma correlação entre duas variáveis, isso não significa que haja causalidade entre elas, ou seja, a correlação entre duas variáveis não significa que a mudança em uma variável seja a causa da mudança na outra. variável.

Assim, assim como o gráfico de dispersão da seção anterior, embora haja uma correlação positiva entre a nota em matemática e a nota em estatística, tirar uma boa nota em matemática não significa tirar uma boa nota em estatística, porque se você estudar apenas matemática, certamente irá reprovar. nas estatísticas. Portanto, as duas variáveis estão relacionadas, mas não são causa e efeito.

Para saber mais, você pode continuar com a seguinte postagem:

Vantagens e desvantagens da nuvem de pontos

Pelas características do gráfico de dispersão, esse tipo de gráfico estatístico apresenta vantagens e desvantagens.

Vantagem:

  • É bastante simples representar uma série de dados em um gráfico de dispersão.
  • O gráfico de dispersão permite analisar visualmente a relação entre duas variáveis, facilitando a obtenção de conclusões.
  • Os gráficos de dispersão também podem ser usados em um estudo estatístico aprofundado como uma exploração preliminar de dados.

Desvantagens:

  • Esses tipos de diagramas não são úteis para representar variáveis qualitativas.
  • A interpretação de um gráfico de dispersão pode levar a uma conclusão errônea de causa e efeito entre duas variáveis.
  • Os gráficos de dispersão não permitem analisar a relação entre mais de duas variáveis.

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *