Freqüentemente, você pode querer agrupar e agregar várias colunas de um DataFrame do pandas. Felizmente, isso é fácil de fazer usando as funções .groupby() e .agg() do pandas. Este tutorial explica vários exemplos de uso prático dessas funções. Exemplo 1: Agrupe...
Muitas vezes você pode querer normalizar os valores de dados de uma ou mais colunas em um DataFrame do pandas. Este tutorial explica duas maneiras de fazer isso: 1. Normalização Mín-Máx. Objetivo: Converte cada valor de dados em um valor entre...
O teste Shapiro-Wilk é um teste de normalidade. É usado para determinar se uma amostra vem ou não de uma distribuição normal . Para realizar um teste Shapiro-Wilk em Python podemos usar a função scipy.stats.shapiro() , que utiliza a seguinte sintaxe:...
O teste Kolmogorov-Smirnov é usado para testar se uma amostra vem ou não de uma determinada distribuição. Para realizar um teste Kolmogorov-Smirnov em Python, podemos usar scipy.stats.kstest() para um teste de uma amostra ou scipy.stats.ks_2samp() para um teste de duas amostras....
Os pesquisadores geralmente coletam amostras de uma população e usam os dados da amostra para tirar conclusões sobre a população como um todo. Um método de amostragem comumente utilizado é a amostragem aleatória estratificada , na qual uma população é dividida...
Freqüentemente, você pode querer sombrear a cor dos pontos em um gráfico de dispersão matplotlib com base em uma terceira variável. Felizmente, isso é fácil de fazer usando a função matplotlib.pyplot.scatter() , que usa a seguinte sintaxe: matplotlib.pyplot.scatter(x, y, s=Nenhum, c=Nenhum,...
Root Mean Square Error (RMSE) é uma métrica que nos diz a que distância nossos valores previstos estão de nossos valores observados em um modelo, em média. É calculado da seguinte forma: RMSE = √[ Σ(P i – O i )...
Freqüentemente, você pode querer alterar o tamanho da fonte de vários elementos em um gráfico Matplotlib. Felizmente, isso é fácil de fazer usando o seguinte código: import matplotlib.pyplot as plt plt. rc ('font', size=10) #controls default text size plt. rc ('axes',...
Um gráfico de contorno é um tipo de gráfico que nos permite visualizar dados tridimensionais em duas dimensões usando contornos. Você pode criar um gráfico de contorno no Matplotlib usando as duas funções a seguir: matplotlib.pyplot.contour() – Cria gráficos de contorno....
Freqüentemente, você pode querer remover marcas de escala de um ou mais eixos em um gráfico Matplotlib. Felizmente, isso é fácil de fazer usando a função tick_params() . Este tutorial mostra vários exemplos de como usar esse recurso na prática, com...