Come eseguire un test jarque-bera in r


Il test Jarque-Bera è un test di bontà di adattamento che determina se i dati del campione presentano o meno asimmetria e curtosi che corrispondono a una distribuzione normale .

La statistica del test Jarque-Bera è sempre un numero positivo e se è lontano da zero indica che i dati del campione non hanno una distribuzione normale.

La statistica del test JB è definita come:

JB =[(n-k+1) / 6] * [S 2 + (0,25*(C-3) 2 )]

dove n è il numero di osservazioni nel campione, k è il numero di regressori (k = 1 se non utilizzato nel contesto della regressione), S è l’asimmetria del campione e C è la curtosi del campione.

Sotto l’ipotesi nulla di normalità , JB ~

Questo tutorial spiega come eseguire un test Jarque-Bera in R.

Test di Jarque-Bera in R

Per eseguire un test Jarque-Bera per un set di dati di esempio, possiamo utilizzare il pacchetto tseries :

 #install (if not already installed) and load tseries package
if(!require(tseries)){install.packages('tseries')}

#generate a list of 100 normally distributed random variables
dataset <- rnorm(100)

#conduct Jarque-Bera test
jarque.bera.test(dataset)

Ciò genera il seguente output:

Questo ci dice che la statistica del test è 0,67446 e il valore p del test è 0,7137. In questo caso non potremmo rifiutare l’ipotesi nulla che i dati siano distribuiti normalmente.

Questo risultato non dovrebbe sorprendere poiché il set di dati che abbiamo generato è composto da 100 variabili casuali che seguono una distribuzione normale.

Consideriamo invece se generassimo un set di dati costituito da un elenco di 100 variabili casuali distribuite uniformemente:

 #install (if not already installed) and load tseries package
if(!require(tseries)){install.packages('tseries')}

#generate a list of 100 uniformly distributed random variables
dataset <- runif(100)

#conduct Jarque-Bera test
jarque.bera.test(dataset)

Ciò genera il seguente output:

Questo ci dice che la statistica del test è 8,0807 e il valore p del test è 0,01759. In questo caso rifiuteremo l’ipotesi nulla che i dati siano distribuiti normalmente. Abbiamo prove sufficienti per affermare che i dati in questo esempio non sono distribuiti normalmente.

Questo risultato non dovrebbe sorprendere poiché il set di dati che abbiamo generato è composto da 100 variabili casuali che seguono una distribuzione uniforme. Dopotutto, i dati devono essere distribuiti in modo uniforme, non normalmente.

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *