A: controleren of meerdere kolommen gelijk zijn
U kunt de volgende methoden gebruiken om te controleren of meerdere kolommen gelijk zijn in een gegevensframe in R:
Methode 1: Controleer of alle kolommen gelijk zijn
library (dplyr) #create new column that checks if all columns are equal df <- df %>% rowwise %>% mutate(match = n_distinct(unlist(cur_data())) == 1 ) %>% A group()
Methode 2: Controleer of specifieke kolommen gelijk zijn
library (dplyr) #create new column that checks if columns 'A', 'C', and 'D' are equal df_temp <- df %>% select(' A ', ' C ', ' D ') %>% rowwise %>% mutate(match = n_distinct(unlist(cur_data())) == 1 ) %>% A group() #add new column to existing data frame df$match <- df_temp$match
De volgende voorbeelden laten zien hoe u elke methode in de praktijk kunt gebruiken met het volgende dataframe:
#create data frame df = data. frame (A=c(4, 0, 3, 3, 6, 8, 7), B=c(4, 2, 3, 5, 6, 4, 7), C=c(4, 0, 3, 3, 5, 10, 7), D=c(4, 0, 3, 3, 3, 8, 7)) #view data frame df ABCD 1 4 4 4 4 2 0 2 0 0 3 3 3 3 3 4 3 5 3 3 5 6 6 5 3 6 8 4 10 8 7 7 7 7 7
Voorbeeld 1: Controleer of alle kolommen gelijk zijn
We kunnen de volgende syntaxis gebruiken om te controleren of de waarde van elke kolom in het dataframe voor elke rij gelijk is:
library (dplyr) #create new column that checks if all columns are equal df <- df %>% rowwise %>% mutate(match = n_distinct(unlist(cur_data())) == 1 ) %>% A group() #view updated data frame df # A tibble: 7 x 5 ABCD match 1 4 4 4 4 TRUE 2 0 2 0 0 FALSE 3 3 3 3 3 TRUE 4 3 5 3 3 FALSE 5 6 6 5 3 FALSE 6 8 4 10 8 FALSE 7 7 7 7 7 TRUE
Als de waarde van elke kolom gelijk is, retourneert de overeenkomende kolom True .
Anders retourneert het False .
Houd er rekening mee dat u True- en False- waarden als volgt naar 1 en 0 kunt converteren met as.numeric() :
library (dplyr) #create new column that checks if all columns are equal df <- df %>% rowwise %>% mutate(match = as. numeric (n_distinct(unlist(cur_data())) == 1 )) %>% A group() #view updated data frame df # A tibble: 7 x 5 ABCD match 1 4 4 4 4 1 2 0 2 0 0 0 3 3 3 3 3 1 4 3 5 3 3 0 5 6 6 5 3 0 6 8 4 10 8 0 7 7 7 7 7 1
Voorbeeld 2: Controleer of specifieke kolommen gelijk zijn
We kunnen de volgende syntaxis gebruiken om te controleren of de waarden in de kolommen A, C en D van het dataframe voor elke rij gelijk zijn:
library (dplyr) #create new column that checks if columns 'A', 'C', and 'D' are equal df_temp <- df %>% select(' A ', ' C ', ' D ') %>% rowwise %>% mutate(match = n_distinct(unlist(cur_data())) == 1 ) %>% A group() #add new column to existing data frame df$match <- df_temp$match #view updated data frame df ABCD match 1 4 4 4 4 TRUE 2 0 2 0 0 TRUE 3 3 3 3 3 TRUE 4 3 5 3 3 TRUE 5 6 6 5 3 FALSE 6 8 4 10 8 FALSE 7 7 7 7 7 TRUE
Als de waarden in de kolommen A, C en D gelijk zijn, retourneert de overeenkomende kolom True .
Anders retourneert het False .
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in R kunt uitvoeren:
Sorteren op meerdere kolommen in R
Hoe bepaalde kolommen in R te behouden
Hoe het aantal exemplaren in kolommen in R te tellen