Una trasformazione box-cox è un metodo comunemente utilizzato per trasformare un set di dati non distribuito normalmente in un set distribuito più normalmente . L’idea alla base di questo metodo è trovare un valore per λ tale che i dati trasformati...
Il test di White viene utilizzato per determinare se l’eteroschedasticità è presente in un modello di regressione. L’eteroschedasticità si riferisce alla dispersione non uniforme dei residui a diversi livelli di una variabile di risposta in un modello di regressione, che viola...
La distanza di Cook viene utilizzata per identificare le osservazioni influenti in un modello di regressione. La formula per la distanza di Cook è: d i = (r i 2 / p*MSE) * (h ii / (1-h ii ) 2 )...
Molti test statistici presuppongono che i valori di una particolare variabile siano distribuiti normalmente . Tuttavia, i valori spesso non sono distribuiti normalmente. Un modo per risolvere questo problema è trasformare la variabile prendendo il logaritmo di ciascun valore. Eseguendo questa...
Nell’analisi di regressione, la multicollinearità si verifica quando due o più variabili predittive sono altamente correlate tra loro, in modo tale da non fornire informazioni univoche o indipendenti nel modello di regressione. Se il grado di correlazione tra le variabili è...
È possibile utilizzare l’istruzione PROC IMPORT per importare rapidamente i dati da un file di testo in SAS. Questa procedura utilizza la seguente sintassi di base: /*import data from text file called data.txt*/ proc import out =my_data datafile ="/home/u13181/data.txt" dbms =dlm...
È possibile utilizzare l’istruzione PROC EXPORT per esportare rapidamente i dati da SAS a un file di testo. Questa procedura utilizza la seguente sintassi di base: /*export data to file called my_data.txt*/ proc export data =my_data outfile ="/home/u13181/my_data.txt" dbms =tab replace...
È possibile utilizzare l’istruzione PROC IMPORT con l’opzione RANGE per importare un intervallo specifico di celle da un file Excel in SAS. Per fare ciò, è possibile utilizzare la seguente sintassi di base: /*import data from Excel file called basketball_data.xlsx*/ proc...
Un test F viene utilizzato per verificare se le varianze di due popolazioni sono uguali. Le ipotesi nulla e alternativa del test sono le seguenti: H 0 : σ 1 2 = σ 2 2 (le varianze della popolazione sono uguali)...
Una matrice di correlazione è una tabella quadrata che mostra i coefficienti di correlazione tra le variabili in un set di dati. Fornisce un modo rapido per comprendere la forza delle relazioni lineari esistenti tra le variabili in un set di...