Vaak ben je misschien geïnteresseerd in een subset van een dataframe op basis van bepaalde voorwaarden in R. Gelukkig is dit eenvoudig te doen met behulp van de functie filter() uit het dplyr- pakket. library(dplyr) In deze tutorial worden verschillende voorbeelden...
Vaak wil je misschien een of meer kolommen verwijderen uit een dataframe in R. Gelukkig is dit eenvoudig te doen met behulp van de select() functie uit het dplyr- pakket. library (dplyr) Deze tutorial toont verschillende voorbeelden van hoe u deze...
Vaak wilt u de kolommen in een dataframe in R opnieuw rangschikken. Gelukkig is dit eenvoudig te doen met de functie select() uit het dplyr- pakket. library (dplyr) Deze tutorial toont verschillende voorbeelden van hoe u deze functie in de praktijk...
Twee van de meest voorkomende taken die u uitvoert bij het analyseren van gegevens zijn het groeperen en samenvatten van gegevens. Gelukkig kun je met het dplyr- pakket in R snel gegevens groeperen en samenvatten. Deze tutorial biedt een korte handleiding...
Vaak ben je misschien geïnteresseerd in het samenvoegen van meerdere dataframes in R. Gelukkig is dit eenvoudig te doen met behulp van de functie left_join() uit het dplyr- pakket. library(dplyr) Stel dat we bijvoorbeeld de volgende drie dataframes hebben: #create data...
Twee statistische toetsen die studenten vaak verwarren zijn de F-Test en de T-Test . In deze tutorial wordt het verschil tussen de twee tests uitgelegd. F-test: de basis Een F-toets wordt gebruikt om te testen of twee populatievarianties gelijk zijn. De...
De Grubbs-test wordt gebruikt om de aanwezigheid van uitbijters in een dataset te identificeren. Om deze test te kunnen gebruiken, moet een dataset ongeveer normaal verdeeld zijn en minimaal zeven waarnemingen bevatten. In deze tutorial wordt uitgelegd hoe u de Grubbs-test...
Vaak wilt u een Panda’s DataFrame op meerdere voorwaarden filteren. Gelukkig is dit eenvoudig te doen met behulp van Booleaanse bewerkingen. Deze zelfstudie biedt verschillende voorbeelden van hoe u de volgende panda’s DataFrame onder verschillende voorwaarden kunt filteren: import pandas as...
Rolling correlaties zijn correlaties tussen twee tijdreeksen over een glijdend venster. Een van de voordelen van dit soort correlatie is dat u de correlatie tussen twee tijdreeksen in de loop van de tijd kunt visualiseren. In deze zelfstudie wordt uitgelegd hoe...
Vaak wilt u misschien rijen verwijderen die enkele of alle NA’s (ontbrekende waarden) bevatten in een dataframe in R. In deze tutorial wordt uitgelegd hoe u deze regels kunt verwijderen met Basic R en het Tidyr- pakket. We zullen het volgende...