Nas estatísticas, a assimetria e a curtose são duas maneiras de medir a forma de uma distribuição. A assimetria é uma medida da assimetria de uma distribuição. Este valor pode ser positivo ou negativo. A assimetria negativa indica que a cauda...
Quartis são valores que dividem um conjunto de dados em quatro partes iguais. O primeiro quartil representa o 25º percentil de um conjunto de dados. O segundo quartil representa o 50º percentil de um conjunto de dados. Este valor é equivalente...
O campo do aprendizado de máquina contém um enorme conjunto de algoritmos que podem ser usados para compreender os dados. Esses algoritmos podem ser classificados em uma das duas categorias a seguir: 1. Algoritmos de aprendizagem supervisionada: envolvem a construção de...
Você pode gerar rapidamente uma distribuição normal em Python usando a função numpy.random.normal() , que usa a seguinte sintaxe: numpy. random . normal (loc=0.0, scale=1.0, size=None) Ouro: loc: Média da distribuição. O valor padrão é 0. escala: Desvio padrão da distribuição....
Os algoritmos de aprendizado de máquina podem ser divididos em dois tipos distintos: algoritmos de aprendizado supervisionado e não supervisionado . Algoritmos de aprendizagem supervisionada podem ser classificados em dois tipos: 1. Regressão: A variável resposta é contínua. Por exemplo, a...
Para avaliar o desempenho de um modelo em um conjunto de dados, precisamos medir até que ponto as previsões do modelo correspondem aos dados observados. Para modelos de regressão , a métrica mais comumente usada é o erro quadrático médio (MSE),...
A regressão linear simples é uma técnica que podemos usar para compreender a relação entre uma única variável explicativa e uma única variável de resposta . Resumindo, esta técnica encontra a linha que melhor “se ajusta” aos dados e assume a...
A regressão linear simples é uma técnica que podemos usar para compreender a relação entre uma única variável explicativa e uma única variável de resposta . Esta técnica encontra a linha que melhor “se ajusta” aos dados e assume a seguinte...
Quando queremos entender a relação entre uma única variável preditora e uma variável de resposta, geralmente usamos regressão linear simples . No entanto, se quisermos entender a relação entre múltiplas variáveis preditoras e uma variável resposta, podemos usar a regressão linear...
Quando queremos entender a relação entre uma ou mais variáveis preditoras e uma variável de resposta contínua, geralmente usamos a regressão linear . Porém, quando a variável resposta é categórica, podemos utilizar a regressão logística . A regressão logística é um...