A multicolinearidade na análise de regressão ocorre quando duas ou mais variáveis preditoras são altamente correlacionadas entre si, de modo que não fornecem informações únicas ou independentes no modelo de regressão. Se o grau de correlação entre as variáveis for alto...
Este tutorial fornece um guia completo para os melhores temas ggplot2, incluindo: Como alterar a aparência dos gráficos usando os temas integrados do ggplot2. Como alterar a aparência dos gráficos usando temas predefinidos da biblioteca ggthemes . Como editar componentes específicos...
Este guia mostra um exemplo de como realizar regressão linear múltipla em R, incluindo: Examine os dados antes de ajustar o modelo Ajuste do modelo Verificando as suposições do modelo Interpretando a saída do modelo Avaliando a qualidade do ajuste do...
A distância de Cook , muitas vezes denotada como Di , é usada na análise de regressão para identificar pontos de dados influentes que podem afetar negativamente seu modelo de regressão. A fórmula para a distância de Cook é: d i...
Uma tabela de frequência bidirecional é uma tabela que exibe as frequências (ou “contagens”) para duas variáveis categóricas. Por exemplo, a tabela bidirecional a seguir mostra os resultados de uma pesquisa que perguntou a 100 pessoas qual esporte elas preferiam: beisebol,...
Muitos testes estatísticos (como ANOVA unidirecional ou ANOVA bidirecional ) assumem que a variância entre vários grupos é igual. Uma forma de testar formalmente esta hipótese é utilizar o teste de Levene , que testa se a variância entre dois ou...
Um gráfico QQ , abreviação de “quantil-quantil”, é um tipo de gráfico que podemos usar para determinar se um conjunto de dados potencialmente vem ou não de uma distribuição teórica. Muitos testes estatísticos assumem que um conjunto de dados segue uma...
Este tutorial fornece uma explicação simples sobre como interpretar a estatística C de um modelo de regressão logística. O que é regressão logística? A regressão logística é um método estatístico que usamos para ajustar um modelo de regressão quando a variável...
O enésimo percentil de um conjunto de dados é o valor que corta os primeiros n por cento dos valores dos dados quando todos os valores são classificados do menor para o maior. Por exemplo, o 90º percentil de um conjunto...
Um teste t de amostras pareadas é um teste estatístico que compara as médias de duas amostras quando cada observação de uma amostra pode ser combinada com uma observação da outra amostra. Por exemplo, digamos que queremos saber se um determinado...