Um gráfico de barras é útil para visualizar as quantidades de diferentes variáveis categóricas. Às vezes queremos criar um gráfico de barras que visualize as quantidades de variáveis categóricas divididas em subgrupos. Por exemplo, podemos querer visualizar as vendas totais de...
Nas estatísticas, uma pontuação z nos diz quantos desvios padrão um determinado valor está em relação à média . Usamos a seguinte fórmula para calcular uma pontuação z: z = (X – μ) / σ Ouro: X é um único valor...
Nas estatísticas, o erro médio absoluto (MAE) é uma forma de medir a precisão de um determinado modelo. É calculado da seguinte forma: MAE = (1/n) * Σ|y i – x i | Ouro: Σ: Um símbolo grego que significa “soma”...
Nas estatísticas, uma proporção populacional refere-se à fração de indivíduos em uma população com uma determinada característica. Por exemplo, suponhamos que 43,8% dos residentes de uma determinada cidade apoiem uma nova lei. O valor 0,438 representa uma proporção populacional. Fórmula para...
Em uma distribuição de frequência, os limites das classes são os valores que separam as classes. Usamos as seguintes etapas para calcular os limites de classe em uma distribuição de frequência: 1. Subtraia o limite superior da primeira classe do limite...
Um histograma é um gráfico que nos ajuda a visualizar a distribuição de valores em um conjunto de dados. Acontece que o número de caixas usadas em um histograma pode ter um enorme impacto na forma como interpretamos os dados. Se...
Skewness é uma forma de descrever a simetria de uma distribuição. Uma distribuição é distorcida se tiver uma “cauda” no lado esquerdo da distribuição: Uma distribuição é assimétrica à direita se tiver uma “cauda” no lado direito da distribuição: E uma...
A função pandas fillna() é útil para preencher valores ausentes nas colunas de um DataFrame do pandas. Este tutorial fornece vários exemplos de uso desta função para preencher valores ausentes para várias colunas no seguinte DataFrame do pandas: import pandas as...
Um teste de tendência Mann-Kendall é usado para determinar se há ou não uma tendência nos dados de séries temporais. Este é um teste não paramétrico, o que significa que não são feitas suposições subjacentes sobre a normalidade dos dados. As...
Um mapa de calor é um tipo de gráfico que usa diferentes tons de cores para representar valores de dados. Este tutorial explica como criar mapas de calor usando a biblioteca de visualização Seaborn Python com o seguinte conjunto de dados:...