Hoe kolommen in r te verwijderen (met voorbeelden)
Vaak wil je misschien een of meer kolommen verwijderen uit een dataframe in R. Gelukkig is dit eenvoudig te doen met behulp van de select() functie uit het dplyr- pakket.
library (dplyr)
Deze tutorial toont verschillende voorbeelden van hoe u deze functie in de praktijk kunt gebruiken met behulp van het volgende dataframe:
#create data frame df <- data. frame (player = c('a', 'b', 'c', 'd', 'e'), position = c('G', 'F', 'F', 'G', 'G'), points = c(12, 15, 19, 22, 32), rebounds = c(5, 7, 7, 12, 11)) #view data frame df player position points rebounds 1 to G 12 5 2 b F 15 7 3 c F 19 7 4 d G 22 12 5th G 32 11
Voorbeeld 1: Kolommen op naam verwijderen
De volgende code laat zien hoe u kolommen op naam uit een dataframe verwijdert:
#remove column named 'points'
df %>% select(-points)
player position rebounds
1 to G 5
2 b F 7
3 c F 7
4 d G 12
5th G 11
Voorbeeld 2: Kolommen uit de lijst verwijderen
De volgende code laat zien hoe u kolommen uit een dataframe verwijdert die in een specifieke lijst staan:
#remove columns named 'points' or 'rebounds' df %>% select(-one_of(' points ', ' rebounds ')) player position 1 a G 2 b F 3c F 4 d L 5th G
Voorbeeld 3: Kolommen binnen bereik verwijderen
De volgende code laat zien hoe u alle kolommen in het bereik van ‚position‘ tot ‚bounces‘ kunt verwijderen:
#remove columns in range from 'position' to 'rebounds'
df %>% select(-(position:rebounds))
player
1 a
2b
3 tbsp
4d
5th
Voorbeeld 4: Kolommen verwijderen die een expressie bevatten
De volgende code laat zien hoe u alle kolommen verwijdert die het woord ‚punten‘ bevatten
#remove columns that contain the word 'points' df %>% select(-contains(' points ')) player position rebounds 1 to G 5 2 b F 7 3 c F 7 4 d G 12 5th G 11
Voorbeeld 5: Verwijder kolommen die met bepaalde letters beginnen
De volgende code laat zien hoe u alle kolommen verwijdert die beginnen met de letters „po“:
#remove columns that start with 'po' df %>% select(-starts_with(' po ')) player rebounds 1 to 5 2 b 7 3 v 7 4 d 12 5 th 11
Voorbeeld 6: Verwijder kolommen die eindigen op bepaalde letters
De volgende code laat zien hoe u alle kolommen verwijdert die eindigen op de letter „s“:
#remove columns that end with 's' df %>% select(-ends_with(' s ')) player position 1 a G 2 b F 3c F 4 d G 5th G
Voorbeeld 7: Kolommen op positie verwijderen
De volgende code laat zien hoe u kolommen op specifieke posities verwijdert:
#remove columns in position 1 and 4
df %>% select(-1, -4)
position points
1 G 12
2 F 15
3 F 19
4 G 22
5 G 32
Opmerking : u kunt hier de volledige documentatie voor de select()- functie vinden.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende bewerkingen kunt uitvoeren met dplyr:
Rijen verwijderen met dplyr
Hoe rijen met NA-waarden te verwijderen met dplyr
Kolommen selecteren op index met behulp van dplyr