Een van de meest gebruikte maatstaven om de voorspellingsnauwkeurigheid van een model te meten is MAPE , wat staat voor Mean Absolute Percentage Error . De formule om MAPE te berekenen is als volgt: MAPE = (1/n) * Σ(|actueel – voorspelling|...
Een cirkeldiagram is een cirkeldiagram waarin ‚taarten‘ worden gebruikt om de relatieve gegevensgrootte weer te geven. In deze tutorial wordt uitgelegd hoe u cirkeldiagrammen in Stata maakt en bewerkt. Hoe u cirkeldiagrammen maakt in Stata We gebruiken een gegevensset met de...
Een QQ-plot , een afkorting van „kwantiel-kwantiel“, wordt vaak gebruikt om te evalueren of de residuen van een regressieanalyse normaal verdeeld zijn of niet. In deze tutorial wordt uitgelegd hoe u een QQ-plot in Stata maakt en interpreteert. Voorbeeld: QQ-plot in...
Logistische regressie is een statistische methode die we gebruiken om een regressiemodel te fitten wanneer de responsvariabele binair is. Om te evalueren hoe goed een logistisch regressiemodel bij een dataset past, kunnen we naar de volgende twee statistieken kijken: Gevoeligheid: de...
Een eenrichtings-ANOVA wordt gebruikt om te bepalen of verschillende niveaus van een verklarende variabele al dan niet tot statistisch verschillende resultaten leiden bij bepaalde responsvariabelen. We zouden bijvoorbeeld graag willen weten of drie onderwijsniveaus (associategraad, bachelorgraad, mastergraad) al dan niet tot...
Lineaire regressie is een methode die we kunnen gebruiken om de relatie tussen een of meer verklarende variabelen en een responsvariabele te begrijpen. Wanneer we lineaire regressie uitvoeren, willen we doorgaans de gemiddelde waarde van de responsvariabele schatten op basis van...
Veel statistische tests vereisen dat een of meer variabelen normaal verdeeld zijn om de testresultaten betrouwbaar te maken. In deze tutorial worden verschillende methoden uitgelegd die u kunt gebruiken om te testen op normaliteit tussen variabelen in Stata. Voor elk van...
Multicollineariteit bij regressieanalyse treedt op wanneer twee of meer verklarende variabelen sterk met elkaar gecorreleerd zijn, zodat ze geen unieke of onafhankelijke informatie verschaffen in het regressiemodel. Als de mate van correlatie tussen variabelen hoog genoeg is, kan dit problemen veroorzaken...
Een Mann-Whitney U-test (ook wel een Wilcoxon-rangsomtest genoemd) wordt gebruikt om de verschillen tussen twee steekproeven te vergelijken wanneer de steekproefverdeling niet normaal verdeeld is en de steekproefomvang klein is (n <30). Het wordt beschouwd als het niet-parametrische equivalent van de...
Multicollineariteit bij regressieanalyse treedt op wanneer twee of meer verklarende variabelen sterk met elkaar gecorreleerd zijn, zodat ze geen unieke of onafhankelijke informatie verschaffen in het regressiemodel. Als de mate van correlatie tussen variabelen hoog genoeg is, kan dit problemen veroorzaken...