Análise de variância (anova)

Este artigo explica o que é análise de variância, também conhecida como ANOVA, em estatística. Assim, você descobrirá como fazer uma análise de variância, o que é a tabela ANOVA e um exercício resolvido passo a passo. Além disso, mostra quais são os pressupostos prévios que devem ser respeitados para realizar uma análise de variância e, por fim, quais são as vantagens e desvantagens da análise ANOVA.

O que é análise de variância (ANOVA)?

Em estatística, a análise de variância , também chamada de ANOVA (Análise de Variância), é uma técnica que permite comparar as variâncias entre as médias de diferentes amostras.

A análise de variância (ANOVA) é usada para analisar se há diferença entre as médias de mais de duas populações. Assim, a análise de variância permite determinar se as médias populacionais de dois ou mais grupos são diferentes, analisando a variabilidade entre as médias amostrais.

A hipótese nula da análise de variância é, portanto, que as médias de todos os grupos analisados são iguais. Enquanto a hipótese alternativa sustenta que pelo menos uma das médias é diferente.

\begin{cases}H_0: \mu_1=\mu_2=\ldots=\mu_k=\mu\\[2ex]H_1: \exists \mu_i\neq \mu \quad i=1,2,\ldots, k\end{cases}

Assim, a análise de variância é particularmente útil para comparar as médias de mais de dois grupos, pois com este tipo de análise é possível estudar as médias de todos os grupos ao mesmo tempo, em vez de comparar as médias aos pares. A seguir veremos quais são as vantagens e desvantagens da análise de variância.

Tabela ANOVA

A análise de variância está resumida em uma tabela chamada tabela ANOVA , cujas fórmulas são as seguintes:

análise de variância ou fórmulas ANOVA

Ouro:

  • n_i

    é o tamanho da amostra i.

  • N

    é o número total de observações.

  • k

    é o número de grupos diferentes na análise de variância.

  • y_{ij}

    é o valor j do grupo i.

  • \overline{y}_{i}

    é a média do grupo i.

  • \overline{y}

    Esta é a média de todos os dados analisados.

Exemplo de Análise de Variância (ANOVA)

Para finalizar a compreensão do conceito de ANOVA, vamos ver como fazer análise de variância resolvendo passo a passo um exemplo.

  • É realizado um estudo estatístico para comparar as notas obtidas por quatro alunos em três disciplinas diferentes (A, B e C). A tabela a seguir detalha as notas obtidas por cada aluno em uma prova com nota máxima de 20. Faça uma análise de variância para comparar as notas obtidas por cada aluno em cada disciplina.

A hipótese nula desta análise de variância é que as médias das pontuações dos três sujeitos são iguais. Por outro lado, a hipótese nula é que algumas dessas médias são diferentes.

\begin{cases}H_0: \mu_A=\mu_B=\mu_C=\mu\\[2ex]H_1: \exists \mu_i\neq \mu \quad i=A, B, C\end{cases}

Para realizar a análise de variância, a primeira coisa a fazer é calcular a média de cada sujeito e a média total dos dados:

\overline{y}_A=\cfrac{14+12+14+10}{4}=12,5

\overline{y}_B=\cfrac{13+14+10+14}{4}=12,75

\overline{y}_C=\cfrac{19+17+16+19}{4}=17,75

\overline{y}=\cfrac{14+12+14+10+13+14+10+14+19+17+16+19}{12}=14,33

Uma vez conhecido o valor das médias, calculamos as somas dos quadrados usando as fórmulas de análise de variância (ANOVA) vistas acima:

\begin{aligned}\displaystyle SS_F&=\sum_{i=1}^k n_i(\overline{y}_i-\overline{y})^2\\[2ex] SS_F&= 4\cdot (12,5-14,33)^2+4\cdot (12,75-14,33)^2+4\cdot (17,75-14,33)^2\\[2ex] SS_F&=70,17\end{aligned}

\begin{aligned}\displaystyle SS_E=&\sum_{i=1}^k\sum_{j=1}^{n_i} (y_{ij}-\overline{y}_i)^2\\[2ex] \displaystyle SS_E=\ &(14-12,5)^2+(12-12,5)^2+(14-12,5)^2+(10-12,5)^2+\\&+(13-12,75)^2+(14-12,75)^2+(10-12,75)^2+(14-12,75)^2+\\&+(19-17,75)^2+(17-17,75)^2+(16-17,75)^2+(19-17,75)^2\\[2ex] SS_E=\ &28,50\end{aligned}

\begin{aligned}\displaystyle SS_T=&\sum_{i=1}^k\sum_{j=1}^{n_i} (y_{ij}-\overline{y})^2\\[2ex] \displaystyle SS_T= \ &(14-14,33)^2+(12-14,33)^2+(14-14,33)^2+(10-14,33)^2+\\&+(13-14,33)^2+(14-14,33)^2+(10-14,33)^2+(14-14,33)^2+\\&+(19-14,33)^2+(17-14,33)^2+(16-14,33)^2+(19-14,33)^2\\[2ex] SS_T= \ &98,67\end{aligned}

Depois determinamos os graus de liberdade do fator, do erro e do total:

GL_F=k-1=3-1=2

GL_E=N-k=12-3=9

GL_F=N-1=12-1=11

Calculamos agora os erros quadráticos médios dividindo as somas dos quadrados do fator e do erro pelos seus respectivos graus de liberdade:

MSE_F=\cfrac{SS_F}{GL_F}=\cfrac{70,17}{2}=35,08

MSE_R=\cfrac{SS_R}{GL_R}=\cfrac{28,50}{9}=3,17

E por fim, calculamos o valor da estatística F dividindo os dois erros calculados na etapa anterior:

F=\cfrac{MSE_F}{MSE_R}=\cfrac{35,09}{3,17}=11,08

Resumindo, a tabela ANOVA para os dados de exemplo ficaria assim:

exemplo de análise de variância (ANOVA)

Depois de calculados todos os valores da tabela ANOVA, resta interpretar os resultados obtidos. Para isso, precisamos encontrar a probabilidade de obter um valor maior que a estatística F em uma distribuição F de Snedecor com os graus de liberdade correspondentes, ou seja, precisamos determinar o valor p do teste:

P[F>11,08]=0,004″ title=”Rendered by QuickLaTeX.com” height=”18″ width=”172″ style=”vertical-align: -5px;”></p>
</p>
<p> Portanto, se tomarmos um nível de significância α=0,05 (o mais comum), devemos rejeitar a hipótese nula e aceitar a hipótese alternativa, uma vez que o valor p do teste é inferior ao nível de significância. Isto significa que pelo menos algumas das médias dos grupos estudados são diferentes de outras.</p>
</p>
<p class=0,004 < 0,05 \ \color{orange}\bm{\longrightarrow}\color{black}\ \text{Se rechaza } H_0

Deve-se notar que atualmente existem vários programas de computador que podem realizar análises de variância em apenas alguns segundos. No entanto, também é importante conhecer a teoria por trás dos cálculos.

Premissas de Análise de Variância (ANOVA)

Para realizar uma análise de variância (ANOVA), as seguintes condições devem ser atendidas:

  • Independência : os valores observados são independentes entre si. Uma forma de garantir a independência das observações é adicionar aleatoriedade ao processo de amostragem.
  • Homocedasticidade : deve haver homogeneidade nas variâncias, ou seja, a variabilidade dos resíduos é constante.
  • Normalidade : Os resíduos devem ter distribuição normal, ou seja, devem seguir uma distribuição normal.
  • Continuidade : A variável dependente deve ser contínua.

Tipos de Análise de Variância (ANOVA)

Existem três tipos de análise de variância (ANOVA) :

  • Análise de variância unidirecional (ANOVA unidirecional) : Na análise de variância, existe apenas um fator, ou seja, existe apenas uma variável independente.
  • Análise de variância bidirecional (ANOVA bidirecional) : A análise de variância possui dois fatores, portanto são analisadas duas variáveis independentes e a interação entre elas.
  • Análise Multivariada de Variância (MANOVA) : Na análise de variância, existe mais de uma variável dependente. O objetivo é determinar se as variáveis independentes mudam de valor quando as variáveis dependentes variam.

Vantagens e desvantagens da análise de variância (ANOVA)

Por fim, veremos quando é adequado utilizarmos a análise de variância e, também, quais os limites deste tipo de análise estatística.

A principal vantagem da análise de variância (ANOVA) é que ela permite comparar mais de dois grupos ao mesmo tempo. Ao contrário do teste t , onde você só pode analisar a média de uma ou duas amostras, a análise de variância é usada para determinar se múltiplas populações têm ou não a mesma média.

No entanto, a análise de variância não nos diz qual grupo de estudo tem uma média diferente, apenas nos permite saber se existem médias significativamente diferentes ou se todas as médias são semelhantes.

Da mesma forma, outra desvantagem da análise de variância é que quatro pressupostos anteriores (ver acima) devem ser cumpridos para realizar a análise ANOVA, caso contrário as conclusões tiradas podem estar erradas. Portanto, deve-se sempre verificar se o conjunto de dados estatísticos atende a estes quatro requisitos.

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *