Como realizar um teste jarque-bera em r


O teste Jarque-Bera é um teste de adequação que determina se os dados da amostra apresentam ou não assimetria e curtose que correspondem a uma distribuição normal .

A estatística do teste Jarque-Bera é sempre um número positivo e se estiver longe de zero indica que os dados amostrais não possuem distribuição normal.

A estatística de teste JB é definida como:

JB =[(n-k+1) / 6] * [S 2 + (0,25*(C-3) 2 )]

onde n é o número de observações na amostra, k é o número de regressores (k = 1 se não for usado no contexto da regressão), S é a assimetria da amostra e C é a curtose da amostra.

Sob a hipótese nula de normalidade , JB ~

Este tutorial explica como realizar um teste Jarque-Bera em R.

Teste Jarque-Bera em R

Para realizar um teste Jarque-Bera para um conjunto de dados de exemplo, podemos usar o pacote tseries :

 #install (if not already installed) and load tseries package
if(!require(tseries)){install.packages('tseries')}

#generate a list of 100 normally distributed random variables
dataset <- rnorm(100)

#conduct Jarque-Bera test
jarque.bera.test(dataset)

Isso gera a seguinte saída:

Isso nos diz que a estatística do teste é 0,67446 e o valor p do teste é 0,7137. Neste caso, não poderíamos rejeitar a hipótese nula de que os dados são normalmente distribuídos.

Este resultado não deve ser surpreendente, uma vez que o conjunto de dados que geramos é composto por 100 variáveis aleatórias que seguem uma distribuição normal.

Em vez disso, considere se gerássemos um conjunto de dados que consiste em uma lista de 100 variáveis aleatórias distribuídas uniformemente:

 #install (if not already installed) and load tseries package
if(!require(tseries)){install.packages('tseries')}

#generate a list of 100 uniformly distributed random variables
dataset <- runif(100)

#conduct Jarque-Bera test
jarque.bera.test(dataset)

Isso gera a seguinte saída:

Isso nos diz que a estatística do teste é 8,0807 e o valor p do teste é 0,01759. Nesse caso, rejeitaríamos a hipótese nula de que os dados são normalmente distribuídos. Temos evidências suficientes para dizer que os dados neste exemplo não têm distribuição normal.

Este resultado não deve ser surpreendente, uma vez que o conjunto de dados que geramos é composto por 100 variáveis aleatórias que seguem uma distribuição uniforme. Afinal, os dados devem ser distribuídos de maneira uniforme, não normalmente.

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *