Come eseguire un test jarque-bera in r
Il test Jarque-Bera è un test di bontà di adattamento che determina se i dati del campione presentano o meno asimmetria e curtosi che corrispondono a una distribuzione normale .
La statistica del test Jarque-Bera è sempre un numero positivo e se è lontano da zero indica che i dati del campione non hanno una distribuzione normale.
La statistica del test JB è definita come:
JB =[(n-k+1) / 6] * [S 2 + (0,25*(C-3) 2 )]
dove n è il numero di osservazioni nel campione, k è il numero di regressori (k = 1 se non utilizzato nel contesto della regressione), S è l’asimmetria del campione e C è la curtosi del campione.
Sotto l’ipotesi nulla di normalità , JB ~
Questo tutorial spiega come eseguire un test Jarque-Bera in R.
Test di Jarque-Bera in R
Per eseguire un test Jarque-Bera per un set di dati di esempio, possiamo utilizzare il pacchetto tseries :
#install (if not already installed) and load tseries package if(!require(tseries)){install.packages('tseries')} #generate a list of 100 normally distributed random variables dataset <- rnorm(100) #conduct Jarque-Bera test jarque.bera.test(dataset)
Ciò genera il seguente output:
Questo ci dice che la statistica del test è 0,67446 e il valore p del test è 0,7137. In questo caso non potremmo rifiutare l’ipotesi nulla che i dati siano distribuiti normalmente.
Questo risultato non dovrebbe sorprendere poiché il set di dati che abbiamo generato è composto da 100 variabili casuali che seguono una distribuzione normale.
Consideriamo invece se generassimo un set di dati costituito da un elenco di 100 variabili casuali distribuite uniformemente:
#install (if not already installed) and load tseries package if(!require(tseries)){install.packages('tseries')} #generate a list of 100 uniformly distributed random variables dataset <- runif(100) #conduct Jarque-Bera test jarque.bera.test(dataset)
Ciò genera il seguente output:
Questo ci dice che la statistica del test è 8,0807 e il valore p del test è 0,01759. In questo caso rifiuteremo l’ipotesi nulla che i dati siano distribuiti normalmente. Abbiamo prove sufficienti per affermare che i dati in questo esempio non sono distribuiti normalmente.
Questo risultato non dovrebbe sorprendere poiché il set di dati che abbiamo generato è composto da 100 variabili casuali che seguono una distribuzione uniforme. Dopotutto, i dati devono essere distribuiti in modo uniforme, non normalmente.