Soms ben je misschien geïnteresseerd in het hercoderen van bepaalde waarden in een dataframe in R. Gelukkig kan dit eenvoudig worden gedaan met behulp van de functie recode() uit het dplyr-pakket. Deze tutorial toont verschillende voorbeelden van praktisch gebruik van deze...
R-kwadraat , vaak geschreven als r2 , is een maatstaf voor hoe goed een lineair regressiemodel bij een reeks gegevens past. In technische termen is het het deel van de variantie in de responsvariabele dat kan worden verklaard door de voorspellende...
In de statistiek zal een hypothesetest vaak resulteren in een T-score-teststatistiek. Zodra we die t-score hebben gevonden, vinden we meestal de bijbehorende p-waarde. Als deze p-waarde onder een bepaald alfaniveau ligt (bijvoorbeeld 0,10, 0,05, 0,01), dan verwerpen we de nulhypothese van...
Een log-log-plot is een spreidingsdiagram dat logaritmische schalen op de x-as en y-as gebruikt. Dit type plot is handig voor het visualiseren van twee variabelen wanneer de werkelijke relatie daartussen een machtswet volgt. Dit fenomeen komt op veel gebieden in de...
Vaak wilt u misschien een vergelijking of functie in Excel plotten. Gelukkig is dit eenvoudig te doen dankzij de ingebouwde Excel-formules. Deze tutorial biedt verschillende voorbeelden van het plotten van vergelijkingen/functies in Excel. Voorbeeld 1: Een lineaire vergelijking tekenen Stel dat...
Vaak wilt u misschien foutbalken toevoegen aan grafieken in Python om de onzekerheid rond metingen of berekende waarden vast te leggen. Gelukkig is dit eenvoudig te doen met behulp van de matplotlib-bibliotheek. In deze tutorial wordt uitgelegd hoe u foutbalken toevoegt...
Vaak wilt u op basis van bepaalde voorwaarden een nieuwe kolom maken in een Panda DataFrame. Deze zelfstudie biedt verschillende voorbeelden van hoe u dit kunt doen met behulp van het volgende DataFrame: import pandas as pd import numpy as np...
Soms wilt u misschien een lege kolom toevoegen aan een Panda’s DataFrame. Gelukkig is het vrij eenvoudig om te doen en deze tutorial laat verschillende voorbeelden zien van hoe je dit kunt doen met behulp van de volgende panda’s DataFrame: import...
In de statistiek vertelt een z-score ons hoeveel standaarddeviaties een waarde afwijkt van het gemiddelde. We gebruiken de volgende formule om een z-score te berekenen: z = (X – μ) / σ Goud: X is een enkele onbewerkte gegevenswaarde μ is...
In de statistiek gebruiken we vaak dePearson-correlatiecoëfficiënt om de lineaire relatie tussen twee variabelen te meten. Soms willen we echter de relatie tussen twee variabelen begrijpen terwijl we een derde variabele controleren . Stel dat we bijvoorbeeld het verband willen meten...