Vaak wilt u mogelijk meerdere kolommen van een Panda DataFrame groeperen en samenvoegen. Gelukkig is dit eenvoudig te doen met de panda’s .groupby() en .agg() functies. In deze tutorial worden verschillende voorbeelden van praktisch gebruik van deze functies uitgelegd. Voorbeeld 1:...
Vaak wil je misschien de datawaarden van een of meer kolommen in een pandas DataFrame normaliseren . In deze zelfstudie worden twee manieren uitgelegd om dit te doen: 1. Min-Max-normalisatie Doel: Converteert elke gegevenswaarde naar een waarde tussen 0 en 1....
De Shapiro-Wilk-test is een test van normaliteit. Het wordt gebruikt om te bepalen of een steekproef wel of niet uit eennormale verdeling komt. Om een Shapiro-Wilk-test in Python uit te voeren, kunnen we de functie scipy.stats.shapiro() gebruiken, die de volgende syntaxis...
De Kolmogorov-Smirnov-test wordt gebruikt om te testen of een steekproef al dan niet uit een bepaalde verdeling komt. Om een Kolmogorov-Smirnov-test in Python uit te voeren, kunnen we scipy.stats.kstest() gebruiken voor een test met één monster of scipy.stats.ks_2samp() voor een test...
Onderzoekers nemen vaak steekproeven uit een populatie en gebruiken de gegevens uit de steekproef om conclusies te trekken over de populatie als geheel. Een veelgebruikte steekproefmethode is de gestratificeerde willekeurige steekproef , waarbij een populatie in groepen wordt verdeeld en een...
Vaak wilt u de kleur van punten in een matplotlib-scatterplot arceren op basis van een derde variabele. Gelukkig is dit eenvoudig te doen met behulp van de functie matplotlib.pyplot.scatter() , die de volgende syntaxis heeft: matplotlib.pyplot.scatter(x, y, s=Geen, c=Geen, cmap=Geen) Goud:...
Root Mean Square Error (RMSE) is een metriek die ons vertelt hoe ver onze voorspelde waarden gemiddeld verwijderd zijn van onze waargenomen waarden in een model. Het wordt als volgt berekend: RMSE = √[ Σ(P ik – O ik ) 2...
Vaak wilt u misschien de lettergrootte van verschillende elementen op een Matplotlib-plot wijzigen. Gelukkig is dit eenvoudig te doen met behulp van de volgende code: import matplotlib.pyplot as plt plt. rc ('font', size=10) #controls default text size plt. rc ('axes', titlesize=10)...
Een contourplot is een type plot waarmee we driedimensionale gegevens in twee dimensies kunnen visualiseren met behulp van contouren. U kunt een contourplot maken in Matplotlib met behulp van de volgende twee functies: matplotlib.pyplot.contour() – Creëert contourplots. matplotlib.pyplot.contourf() – Creëert gevulde...
Vaak wilt u misschien de maatstreepjes verwijderen van een of meer assen in een Matplotlib-plot. Gelukkig is dit eenvoudig te doen met behulp van de tick_params() functie. Deze tutorial toont verschillende voorbeelden van hoe u deze functie in de praktijk kunt...