Wanneer u een Chi-kwadraattoets uitvoert, krijgt u een toetsingsstatistiek. Om te bepalen of de resultaten van de Chi-kwadraattoets statistisch significant zijn, kunt u de teststatistieken vergelijken met een kritische Chi-kwadraatwaarde . Als de teststatistiek groter is dan de kritische Chi-kwadraatwaarde, zijn...
Een betrouwbaarheidsinterval voor een gemiddelde is een reeks waarden die waarschijnlijk een populatiegemiddelde met een bepaald betrouwbaarheidsniveau bevatten. Het wordt als volgt berekend: Betrouwbaarheidsinterval = x +/- t*(s/√n) Goud: x : steekproefgemiddelden t: t-waarde die overeenkomt met het betrouwbaarheidsniveau s: standaardafwijking...
Een betrouwbaarheidsinterval is een reeks waarden die waarschijnlijk een populatieparameter met een bepaald betrouwbaarheidsniveau bevatten. In deze zelfstudie wordt uitgelegd hoe u een betrouwbaarheidsinterval voor een gegevensset in Python kunt plotten met behulp van de Seaborn-visualisatiebibliotheek . Betrouwbaarheidsintervallen uitzetten met lineplot()...
Een QQ-plot , een afkorting van „quantile-quantile“, wordt vaak gebruikt om te evalueren of een dataset mogelijk afkomstig is van een theoretische distributie. In de meeste gevallen wordt dit type plot gebruikt om te bepalen of een dataset al dan niet...
In regressieanalyse verwijst heteroskedasticiteit naar de ongelijke spreiding van residuen. Meer precies is dit het geval wanneer er een systematische verandering optreedt in de verdeling van de residuen over het bereik van de gemeten waarden. Heteroscedasticiteit is een probleem omdat de...
Multicollineariteit bij regressieanalyse treedt op wanneer twee of meer verklarende variabelen sterk met elkaar gecorreleerd zijn, zodat ze geen unieke of onafhankelijke informatie verschaffen in het regressiemodel. Als de mate van correlatie tussen variabelen hoog genoeg is, kan dit problemen veroorzaken...
Een residuele plot is een type plot dat gepaste waarden weergeeft tegen de residuen van een regressiemodel . Dit type plot wordt vaak gebruikt om te evalueren of een lineair regressiemodel al dan niet geschikt is voor een bepaalde dataset en...
Een van de aannames van lineaire regressie is dat er geen correlatie bestaat tussen de residuen. Met andere woorden, er wordt aangenomen dat de residuen onafhankelijk zijn. Eén manier om te bepalen of aan deze veronderstelling wordt voldaan, is door een...
Een Anderson-Darling-test is een goodness-of-fit-test die meet hoe goed uw gegevens in een bepaalde verdeling passen. Deze test wordt meestal gebruikt om te bepalen of uw gegevens al dan niet een normale verdeling volgen. Dit type test is handig voor het...
Een binomiale test vergelijkt een steekproefaandeel met een hypothetisch deel. Stel dat we bijvoorbeeld een zeszijdige dobbelsteen hebben. Als we het 12 keer gooien, verwachten we dat het getal „3“ 1/6 van de tijd verschijnt, wat 12 * (1/6) = 2...