A: verwijder kolommen als de naam een specifieke tekenreeks bevat


U kunt de volgende methoden gebruiken om kolommen te verwijderen uit een dataframe in R waarvan de naam specifieke tekenreeksen bevat:

Methode 1: Kolommen verwijderen als de naam een specifieke tekenreeks bevat

 library (dplyr)

df_new <- df %>% select(-contains(' this_string '))

Methode 2: Kolommen verwijderen als de naam een van meerdere specifieke tekenreeksen bevat

 library (dplyr)

df_new <- df %>% select(-contains(c(' string1 ', ' string2 ', ' string3 ')))

De volgende voorbeelden laten zien hoe u elke methode in de praktijk kunt gebruiken met het volgende dataframe in R:

 #create data frame
df <- data. frame (team_name=c('A', 'B', 'C', 'D', 'E', 'F'),
                 team_location=c('AU', 'AU', 'EU', 'EU', 'AU', 'EU'),
                 player_name=c('Andy', 'Bob', 'Chad', 'Dan', 'Ed', 'Fran'),
                 dots=c(22, 29, 35, 30, 18, 12))

#view data frame
df

  team_name team_location player_name points
1 A AU Andy 22
2 B AU Bob 29
3 C EU Chad 35
4 D EU Dan 30
5 E TO Ed 18
6 F EU Fran 12

Voorbeeld 1: Kolommen verwijderen als naam een specifieke tekenreeks bevat

We kunnen de volgende syntaxis gebruiken om alle kolommen uit het dataframe te verwijderen die ‚team‘ ergens in de kolomnaam bevatten:

 library (dplyr)

#drop columns that contain 'team'
df_new <- df %>% select(-contains(' team '))

#view new data frame
df_new

  player_name points
1 Andy 22
2 Bob 29
3 Chad 35
4 Dan 30
5 Ed 18
6 Fran 12

Houd er rekening mee dat de twee kolommen met ‚team‘ in de naam uit het gegevensframe zijn verwijderd.

Voorbeeld 2: Kolommen verwijderen als de naam een van meerdere specifieke tekenreeksen bevat

We kunnen de volgende syntaxis gebruiken om alle kolommen uit het dataframe te verwijderen die ’speler‘ of ‚punten‘ ergens in de kolomnaam bevatten:

 #drop columns whose name contains 'player' or 'points'
df_new <- df %>% select(-contains(c(' player ', ' points ')))

#view new data frame
df

  team_name team_location
1 A AU
2 B AU
3 C EU
4 D EU
5 E AU
6 F EU

Merk op dat de twee kolommen met „speler“ of „punten“ in de naam uit het dataframe zijn verwijderd.

Opmerking : u kunt hier de volledige documentatie voor de functie dplyr select() vinden.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in R kunt uitvoeren:

Kolommen op naam verwijderen in R
Hoe bepaalde kolommen in R te behouden
Hoe dataframekolommen te hernoemen in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert