Boxplots zijn handig voor het visualiseren van de vijfcijferige samenvatting van een dataset, waaronder: Minimum Het eerste kwartiel De mediaan Het derde kwartiel Het maximum Gerelateerd: Een zachte introductie tot boxplots Gelukkig is het eenvoudig om boxplots in R te maken...
Standaard rangschikt ggplot2 de staven in een staafdiagram in de volgende volgorde: Factorvariabelen worden geclassificeerd op factorniveau. Karaktervariabelen worden alfabetisch weergegeven. Het kan echter voorkomen dat u geïnteresseerd bent om de repen in een andere specifieke volgorde te bestellen. In deze...
Onderzoekers nemen vaak steekproeven uit een populatie en gebruiken de gegevens uit de steekproef om conclusies te trekken over de populatie als geheel. Een veelgebruikte steekproefmethode is de gestratificeerde willekeurige steekproef , waarbij een populatie in groepen wordt verdeeld en een...
Onderzoekers nemen vaak steekproeven uit een populatie en gebruiken de gegevens uit de steekproef om conclusies te trekken over de populatie als geheel. Een veelgebruikte bemonsteringsmethode is clusterbemonstering , waarbij een populatie in clusters wordt verdeeld en alle leden van bepaalde...
Onderzoekers nemen vaak steekproeven uit een populatie en gebruiken de gegevens uit de steekproef om conclusies te trekken over de populatie als geheel. Een veelgebruikte bemonsteringsmethode is systematische bemonstering , die wordt geïmplementeerd in een eenvoudig proces van twee stappen: 1....
Bij tijdreeksanalyse is een voortschrijdend gemiddelde eenvoudigweg de gemiddelde waarde van een aantal voorgaande perioden. Een exponentieel voortschrijdend gemiddelde is een soort voortschrijdend gemiddelde dat meer gewicht toekent aan recente waarnemingen, wat betekent dat het recente trends sneller kan vastleggen. In...
CSV-bestanden (door komma’s gescheiden waarden) zijn een van de meest gebruikelijke manieren om gegevens op te slaan. Gelukkig kun je met de pandas read_csv()- functie eenvoudig CSV-bestanden in Python lezen in vrijwel elk gewenst formaat. In deze tutorial worden verschillende manieren...
Excel-bestanden zijn een van de meest voorkomende manieren om gegevens op te slaan. Gelukkig maakt de pandas read_excel() functie het gemakkelijk om Excel-bestanden te lezen. In deze tutorial worden verschillende manieren uitgelegd om Excel-bestanden in Python te lezen met behulp van...
Vaak hebt u mogelijk meerdere panda’s DataFrames die u naar meerdere Excel-werkbladen in dezelfde werkmap wilt schrijven. Gelukkig kan dit worden gedaan met behulp van de panda’s ExcelWriter() -functie. Om deze functie te gebruiken, moet u er eerst voor zorgen dat...
Vaak wilt u meerdere Excel-bladen importeren en combineren in één Panda DataFrame. Stel dat u bijvoorbeeld de volgende Excel-werkmap hebt met de naam data.xlsx met drie verschillende bladen die allemaal twee kolommen met basketbalspelergegevens bevatten: We kunnen elk blad eenvoudig importeren...