Dados longos ou largos: qual a diferença?


Um conjunto de dados pode ser escrito em dois formatos diferentes: largo e longo .

Um formato amplo contém valores que não se repetem na primeira coluna.

Um formato longo contém valores que se repetem na primeira coluna.

Por exemplo, considere os dois conjuntos de dados a seguir que contêm exatamente os mesmos dados expressos em formatos diferentes:

Formato de dados largo ou longo

Observe que no conjunto de dados estendido , cada valor na primeira coluna é único.

Em contraste, no conjunto de dados longo , os valores da primeira coluna se repetem.

Ambos os conjuntos de dados contêm exatamente as mesmas informações da equipe, mas são simplesmente expressas em formatos diferentes.

Quando usar dados largos ou longos

Dependendo do que você deseja fazer com seus dados, pode fazer mais sentido apresentá-los em formato amplo ou longo.

Quando usar formato grande

Como regra geral, se você estiver analisando dados, normalmente usará um formato de dados amplo .

Por exemplo, se você quiser saber a média de pontos, assistências e rebotes marcados por equipe, muitas vezes é mais fácil ter os dados em um formato grande:

A maioria dos conjuntos de dados que você encontra no mundo real também será salva em um formato amplo porque é mais fácil para o nosso cérebro interpretar.

Por exemplo, no formato acima é fácil ler os valores de pontos, assistências e rebotes de cada equipe na mesma linha.

Quando usar formato longo

Normalmente, se você estiver visualizando múltiplas variáveis em um gráfico usando um software estatístico como R , normalmente será necessário converter seus dados para um formato longo para que o software possa criar o gráfico.

Para exemplos do mundo real, confira estes tutoriais R onde os dados devem estar em um formato longo para criar certos tipos de gráficos:

Às vezes, você pode precisar remodelar seus dados em um formato diferente se também estiver usando Python .

Os tutoriais a seguir explicam como remodelar frames de dados em Python:

Recursos adicionais

Os tutoriais a seguir fornecem informações sobre outros termos estatísticos comumente usados:

O que é uma observação nas estatísticas?
O que é uma covariável nas estatísticas?
O que são resíduos nas estatísticas?

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *