De test van White wordt gebruikt om te bepalen of heteroscedasticiteit aanwezig is in een regressiemodel. Heteroscedasticiteit verwijst naar de ongelijke spreiding van residuen op verschillende niveaus van eenresponsvariabele in een regressiemodel, wat in strijd is met een van de belangrijkste...
Cook’s afstand wordt gebruikt om invloedrijke observaties in een regressiemodel te identificeren. De formule voor Cook’s afstand is: d ik = ( ri 2 / p*MSE) * (h ii / (1-h ii ) 2 ) Goud: ri is het i –...
Veel statistische tests gaan ervan uit dat de waarden van een bepaalde variabele normaal verdeeld zijn. De waarden zijn echter vaak niet normaal verdeeld. Eén manier om dit probleem op te lossen is door de variabele te transformeren door het logbestand...
Bij regressieanalyse treedt multicollineariteit op wanneer twee of meer voorspellende variabelen sterk met elkaar gecorreleerd zijn, zodat ze geen unieke of onafhankelijke informatie verschaffen in het regressiemodel. Als de mate van correlatie tussen variabelen hoog genoeg is, kan dit problemen veroorzaken...
U kunt de PROC IMPORT- instructie gebruiken om snel gegevens uit een tekstbestand in SAS te importeren. Deze procedure gebruikt de volgende basissyntaxis: /*import data from text file called data.txt*/ proc import out =my_data datafile ="/home/u13181/data.txt" dbms =dlm replace ; getnames...
U kunt de PROC EXPORT- instructie gebruiken om snel gegevens van SAS naar een tekstbestand te exporteren. Deze procedure gebruikt de volgende basissyntaxis: /*export data to file called my_data.txt*/ proc export data =my_data outfile ="/home/u13181/my_data.txt" dbms =tab replace ; run ;...
U kunt de PROC IMPORT- instructie met de optie RANGE gebruiken om een specifiek celbereik uit een Excel-bestand in SAS te importeren. Om dit te doen, kunt u de volgende basissyntaxis gebruiken: /*import data from Excel file called basketball_data.xlsx*/ proc import...
Een F-toets wordt gebruikt om te testen of twee populatievarianties gelijk zijn. De nul- en alternatieve hypothesen van de test zijn als volgt: H 0 : σ 1 2 = σ 2 2 (populatievarianties zijn gelijk) H A : σ 1...
Een correlatiematrix is een vierkante tabel die decorrelatiecoëfficiënten tussen variabelen in een dataset weergeeft. Het biedt een snelle manier om de kracht van lineaire relaties tussen variabelen in een dataset te begrijpen. U kunt de PROC CORR- instructie in SAS gebruiken...
Een QQ-plot, een afkorting van ‘quantile-quantile’, wordt gebruikt om te evalueren of een dataset mogelijk afkomstig is van een theoretische distributie. In de meeste gevallen wordt dit type plot gebruikt om te bepalen of een dataset al dan niet een normale...