So zählen sie duplikate in r: mit beispielen


Sie können die folgenden Methoden verwenden, um Duplikate in einem Datenrahmen in R zu zählen:

Methode 1: Zählen Sie doppelte Werte in einer Spalte

 sum(duplicated(df$my_column))

Methode 2: Zählen Sie doppelte Zeilen

 nrow(df[duplicated(df), ])

Methode 3: Duplikate für jede eindeutige Zeile zählen

 library (dplyr)

df %>% group_by_all() %>% count

Die folgenden Beispiele zeigen, wie jede Methode in der Praxis mit dem folgenden Datenrahmen in R verwendet wird:

 #create data frame
df = data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                position=c('G', 'G', 'G', 'F', 'G', 'G', 'F', 'F'),
                points=c(5, 5, 8, 10, 5, 7, 10, 10))

#view data frame
df

  team position points
1 GA 5
2 AG 5
3 AG 8
4 AF 10
5 BG 5
6 BG 7
7 BF 10
8 BF 10

Beispiel 1: Zählen Sie doppelte Werte in einer Spalte

Der folgende Code zeigt, wie die Anzahl der doppelten Werte in der Punktespalte gezählt wird:

 #count number of duplicate values in points column
sum(duplicated(df$points))

[1] 4

Wir können sehen, dass die Punktespalte 4 doppelte Werte enthält.

Beispiel 2: Doppelte Zeilen zählen

Der folgende Code zeigt, wie die Anzahl der doppelten Zeilen im Datenrahmen gezählt wird:

 #count number of duplicate rows
nrow(df[duplicated(df), ])

[1] 2

Wir können sehen, dass der Datenrahmen zwei doppelte Zeilen enthält.

Wir können die folgende Syntax verwenden, um diese beiden doppelten Zeilen anzuzeigen:

 #display duplicated rows
df[duplicated(df), ]

  team position points
2 AG 5
8 BF 10

Beispiel 3: Duplikate für jede eindeutige Zeile zählen

Der folgende Code zeigt, wie die Anzahl der Duplikate für jede eindeutige Zeile im Datenrahmen gezählt wird:

 library (dplyr)

#count number of duplicate rows in data frame
df %>% group_by_all() %>% count

# A tibble: 6 x 4
# Groups: team, position, points [6]
  team position points n
         
1 AF 10 1
2 AG 5 2
3 GA 8 1
4 BF 10 2
5 BG 5 1
6 BG 7 1

Spalte n zeigt die Anzahl der Duplikate für jede eindeutige Zeile an.

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in R ausführen:

So finden Sie doppelte Elemente mit dplyr
So entfernen Sie doppelte Zeilen in R
So entfernen Sie doppelte Zeilen in R, sodass keine mehr übrig sind

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert