Twee termen die studenten vaak verwarren in de statistiek zijn standaardfout en foutmarge . De standaardfout meet de nauwkeurigheid van een schatting van een populatiegemiddelde. Het wordt als volgt berekend: Standaardfout = s / √n Goud: s: standaardafwijking van het monster...
Een paarplot is een spreidingsdiagrammatrix waarmee u de paarsgewijze relatie tussen verschillende variabelen in een gegevensset kunt begrijpen. Gelukkig is het eenvoudig om een parenplot in R te maken met behulp van de functie pairs() . Deze tutorial biedt verschillende voorbeelden...
De binomiale verdeling beschrijft de waarschijnlijkheid van het behalen van k successen in n binomiale experimenten. Als een willekeurige variabele X een binominale verdeling volgt, kan de kans dat X = k succes wordt gevonden met de volgende formule: P(X=k) =...
Een gelijktijdige variabele (ook wel een „covariabele“ genoemd) is een variabele die niet van primair belang is in een onderzoek, maar die niettemin enige interactie kan hebben met de variabele(n) die van belang zijn die wordt onderzocht. Als er geen rekening...
Relatieve frequentie meet hoe vaak een bepaalde waarde in een dataset voorkomt ten opzichte van het totale aantal waarden in een dataset. Je kunt de volgende functie in Python gebruiken om relatieve frequenties te berekenen: def rel_freq (x): freqs = [(value,...
Een betrouwbaarheidsinterval is een reeks waarden die waarschijnlijk een populatieparameter met een bepaald betrouwbaarheidsniveau bevatten. In deze zelfstudie wordt uitgelegd hoe u een betrouwbaarheidsinterval voor een gegevensset in R kunt plotten. Voorbeeld: een betrouwbaarheidsinterval in R uitzetten Stel dat we de...
Wanneer u een eenvoudige lineaire regressie uitvoert, wilt u vaak een spreidingsdiagram maken om de verschillende combinaties van x- en y-waarden te visualiseren, evenals de geschatte regressielijn. Gelukkig zijn er twee eenvoudige manieren om dit type plot in Python te maken....
Een stengel- en bladgrafiek is een grafiek waarin gegevens worden weergegeven door elke waarde in een gegevensset te verdelen in een stengel en een blad . Dit is een unieke plot omdat het ons helpt de vorm van een verdeling te...
Vaak wilt u de rijen van een dataframe in R in een specifieke volgorde rangschikken. Gelukkig is dit eenvoudig te doen met behulp van de functie arrange() uit de dplyr- bibliotheek. In deze tutorial worden verschillende voorbeelden van praktisch gebruik van...
Vaak ben je misschien geïnteresseerd in het tellen van het aantal observaties per groep in R. Gelukkig is dit eenvoudig te doen met behulp van de count() -functie van de dplyr- bibliotheek. In deze tutorial worden verschillende voorbeelden van praktisch gebruik...