Como realizar um teste jarque-bera em python


O teste Jarque-Bera é um teste de adequação que determina se os dados da amostra apresentam ou não assimetria e curtose que correspondem a uma distribuição normal.

A estatística do teste Jarque-Bera é sempre um número positivo e quanto mais distante de zero, mais evidências existem de que os dados da amostra não seguem uma distribuição normal.

Este tutorial explica como realizar um teste Jarque-Bera em Python.

Como realizar um teste Jarque-Bera em Python

Para realizar um teste Jarque-Bera em Python você pode usar a função jarque_bera da biblioteca Scipy, que utiliza a seguinte sintaxe:

jarque_bera(x)

Ouro:

  • x: uma tabela de observações

Esta função retorna uma estatística de teste e um valor p correspondente.

Exemplo 1

Suponha que realizamos um teste de Jarque-Bera em uma lista de 5.000 valores que segue uma distribuição normal:

 import numpy as np
import scipy.stats as stats

#generate array of 5000 values that follows a standard normal distribution
np.random.seed(0)
data = np.random.normal(0, 1, 5000)

#perform Jarque-Bera test
stats.jarque_bera(data)

(statistic=1.2287, pvalue=0.54098)

A estatística de teste é 1,2287 e o valor p correspondente é 0,54098 . Como esse valor p não é inferior a 0,05, não rejeitamos a hipótese nula. Não temos evidências suficientes para afirmar que esses dados apresentam assimetria e curtose significativamente diferentes de uma distribuição normal.

Este resultado não deveria ser surpreendente, uma vez que os dados que geramos são compostos por 5.000 variáveis aleatórias que seguem uma distribuição normal.

Exemplo 2

Agora suponhamos que realizamos um teste de Jarque-Bera em uma lista de 5.000 valores que seguem uma distribuição uniforme:

 import numpy as np
import scipy.stats as stats

#generate array of 5000 values that follows a uniform distribution
np.random.seed(0)
data = np.random.uniform(0, 1, 5000)

#perform Jarque-Bera test
stats.jarque_bera(data)

(statistic=300.1043, pvalue=0.0)

A estatística de teste é 300,1043 e o valor p correspondente é 0,0 . Como este valor p é inferior a 0,05, rejeitamos a hipótese nula. Assim, temos evidências suficientes para argumentar que esses dados apresentam assimetria e curtose significativamente diferentes de uma distribuição normal.

Este resultado também não deve surpreender, uma vez que os dados que geramos são compostos por 5.000 variáveis aleatórias que seguem uma distribuição uniforme, que deve ter assimetria e curtose muito diferentes de uma distribuição normal.

Quando usar o teste Jarque-Bera

O teste Jarque-Bera é normalmente usado para grandes conjuntos de dados (n > 2.000) nos quais outros testes de normalidade (como o teste Shapiro-Wilk) não são confiáveis.

Este é um teste apropriado para ser usado antes de realizar uma análise na qual se assume que o conjunto de dados segue uma distribuição normal. Um teste de Jarque-Bera pode dizer se esta suposição é satisfeita ou não.

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *