Een vijfcijferige samenvatting is een manier om een reeks gegevens samen te vatten met behulp van de volgende vijf waarden: Minimum Het eerste kwartiel De mediaan Het derde kwartiel Het maximum De samenvatting met vijf cijfers is nuttig omdat deze als...
Een boxplot is een type diagram dat we kunnen gebruiken om de vijfcijferige samenvatting van een dataset te visualiseren, waaronder: Minimum Het eerste kwartiel De mediaan Het derde kwartiel Het maximum In deze tutorial wordt uitgelegd hoe u een boxplot maakt...
Het interkwartielbereik , vaak IQR genoemd, is een manier om de verdeling van de middelste 50% van een dataset te meten. Het wordt berekend als het verschil tussen het eerste kwartiel (Q1) en het derde kwartiel (Q3) van een dataset. Houd...
Het middenbereik van een dataset wordt berekend als: Middenbereik = (grootste waarde + kleinste waarde) / 2 Deze waarde is simpelweg het gemiddelde van de grootste en kleinste waarden in de dataset en geeft ons een idee waar het midden van...
Een variatiecoëfficiënt , vaak afgekort tot CV , is een manier om de spreiding van waarden in een dataset ten opzichte van het gemiddelde te meten. Het wordt als volgt berekend: CV = σ / μ Goud: σ: de standaardafwijking van...
De gemiddelde absolute afwijking is een manier om de spreiding van een reeks gegevenswaarden te meten. Een lage waarde voor de gemiddelde absolute afwijking geeft aan dat de gegevenswaarden sterk geconcentreerd zijn. Een hogere waarde voor de gemiddelde absolute afwijking geeft...
In de statistiek zijn scheefheid en kurtosis twee manieren om de vorm van een verdeling te meten. Scheefheid is een maatstaf voor de scheefheid van een verdeling. Deze waarde kan positief of negatief zijn. Negatieve scheefheid geeft aan dat de staart...
De standaardfout van het gemiddelde is een manier om de verdeling van waarden in een dataset te meten. Het wordt als volgt berekend: Standaardfout = s / √n Goud: s : standaardafwijking van het monster n : steekproefomvang In deze tutorial...
Wanneer we een lineair regressiemodel in R passen, neemt het model de volgende vorm aan: Y = β 0 + β 1 X + … + β ik waarbij ϵ een foutterm is die onafhankelijk is van X. Hoe X ook...
De standaardfout van het gemiddelde is een manier om de verdeling van waarden in een dataset te meten. Het wordt als volgt berekend: Standaardfout van het gemiddelde = s / √n Goud: s : standaardafwijking van het monster n : steekproefomvang...