A: hoe u unieke rijen in meerdere kolommen kunt vinden
U kunt de volgende methoden gebruiken om unieke rijen in meerdere kolommen van een dataframe in R te vinden:
Methode 1: Vind unieke rijen in meerdere kolommen (verwijder andere kolommen)
df_unique <- unique(df[c(' col1 ', ' col2 ')])
Methode 2: Vind unieke rijen in meerdere kolommen (behoud andere kolommen)
df_unique <- df[!duplicated(df[c(' col1 ', ' col2 ')]),]
De volgende voorbeelden laten zien hoe u elk van deze methoden in de praktijk kunt gebruiken met het volgende dataframe:
#create data frame
df <- data. frame (conf=c('East', 'East', 'East', 'West', 'West', 'West'),
pos=c('G', 'G', 'F', 'G', 'F', 'F'),
dots=c(33, 28, 31, 39, 34, 40))
#view data frame
df
conf pos points
1 East G 33
2 East G 28
3 East F 31
4 West G 39
5 West F 34
6 West F 40
Methode 1: Vind unieke rijen in meerdere kolommen (verwijder andere kolommen)
De volgende code laat zien hoe u unieke rijen kunt vinden in de conf- en pos- kolommen van het dataframe:
#find unique rows across conf and pos columns
df_unique <- unique(df[c(' conf ', ' pos ')])
#view results
df_unique
conf pos
1 East G
3 East
4 West G
5 West
Het resultaat zijn vier unieke lijnen.
Houd er ook rekening mee dat de puntenkolom automatisch uit de resultaten is verwijderd.
Methode 2: Zoek enkele rijen in meerdere kolommen (andere kolommen verwijderen)
De volgende code laat zien hoe u afzonderlijke rijen in de conf- en pos- kolommen van het dataframe kunt vinden en de waarden in de puntenkolom kunt behouden:
#find unique rows across conf and pos columns
df_unique <- df[!duplicated(df[c(' conf ', ' pos ')]),]
#view results
df_unique
conf pos points
1 East G 33
3 East F 31
4 West G 39
5 West F 34
Merk op dat er slechts enkele rijen bestaan in de conf- en pos- kolommen en dat de waarden in de puntenkolom behouden blijven.
Het is belangrijk op te merken dat alleen de waarde van de eerste unieke gebeurtenis behouden blijft.
Er waren bijvoorbeeld twee rijen met „Oost“ en „G“ in de eerste twee kolommen, maar alleen de puntwaarde (33) voor de eerste keer dat deze unieke combinatie voorkomt, werd behouden in het laatste gegevensframe.
Op dezelfde manier waren er twee rijen met „West“ en „F“ in de eerste twee kolommen, maar alleen de puntwaarde (34) voor de eerste keer dat deze unieke combinatie voorkomt, werd behouden in het laatste dataframe.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in R kunt uitvoeren:
Hoe unieke waarden in een kolom in R te vinden
Hoe unieke waarden per groep te tellen in R
Hoe unieke waarden te filteren met dplyr