Quando a relação entre um conjunto de variáveis preditoras e uma variável de resposta é muito complexa, frequentemente usamos métodos não lineares para modelar a relação entre elas. Um desses métodos são as árvores de classificação e regressão (geralmente abreviadas como...
Quando a relação entre um conjunto de variáveis preditoras e uma variável de resposta é muito complexa, frequentemente usamos métodos não lineares para modelar a relação entre elas. Um desses métodos é construir uma árvore de decisão . No entanto, a...
Uma distribuição amostral é uma distribuição de probabilidade de uma determinada estatística baseada em muitas amostras aleatórias de uma única população . Este tutorial explica como fazer o seguinte com distribuições de amostragem no Excel: Gere uma distribuição amostral. Visualize a...
Muitas vezes você pode querer selecionar uma amostra aleatória de um conjunto de dados no Excel. Felizmente, isso é fácil de fazer usando a função RAND() , que gera um número aleatório entre 0 e 1. Este tutorial fornece um exemplo...
Um gráfico de localização em escala é um tipo de gráfico que exibe os valores ajustados de um modelo de regressão ao longo do eixo x e a raiz quadrada dos resíduos padronizados ao longo do eixo y. Olhando para este...
Um intervalo de confiança é um intervalo de valores que provavelmente contém um parâmetro populacional com um certo nível de confiança. É calculado de acordo com a seguinte fórmula geral: Intervalo de confiança = (estimativa pontual) +/- (valor crítico)* (erro padrão)...
R é uma das linguagens de programação mais populares para trabalhar com dados. Mas antes de podermos trabalhar com dados, precisamos importá-los para o R! Se seus dados já estiverem em um arquivo CSV ou Excel, você pode seguir as etapas...
A distribuição normal é a distribuição mais comumente usada em todas as estatísticas e é conhecida por ser simétrica e em forma de sino. Uma distribuição intimamente relacionada é a distribuição t , que também é simétrica e em forma de...
A maioria dos algoritmos de aprendizado de máquina supervisionado são baseados no uso de um único modelo preditivo, como regressão linear , regressão logística , regressão de crista , etc. No entanto, métodos como ensacamento e florestas aleatórias constroem muitos modelos...
Muitas vezes, em estatística, queremos recolher dados para que possamos responder a certas questões de investigação. Por exemplo, podemos querer responder às seguintes perguntas: 1. Qual é a renda familiar média em Miami, Flórida? 2. Qual é o peso médio de...