So zählen sie eindeutige werte in einer spalte in r


Mit den folgenden Methoden können Sie die Anzahl der eindeutigen Werte in einer Spalte eines Datenrahmens in R zählen:

Methode 1: Verwenden Sie Base R

 length(unique(df$my_column))

Methode 2: dplyr verwenden

 library (dplyr)

n_distinct(df$my_column)

Die folgenden Beispiele zeigen, wie jede Methode in der Praxis mit dem folgenden Datenrahmen verwendet wird:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'C', 'C', 'D'),
                 points=c(10, 13, 14, 14, 18, 19, 20, 20, 22))

#view data frame
df

  team points
1 to 10
2 to 13
3 to 14
4 to 14
5 B 18
6 B 19
7 C 20
8 C 20
9 D 22

Methode 1: Zählen Sie eindeutige Werte in der Spalte mithilfe der R-Basis

Der folgende Code zeigt, wie die Anzahl der eindeutigen Werte in der Punktspalte des Datenrahmens mithilfe von R-Basisfunktionen gezählt wird:

 #count unique values in points column
length(unique(df$points))

[1] 7

In der Punktespalte gibt es 7 eindeutige Werte.

Um die Anzahl der eindeutigen Werte in jeder Spalte des Datenrahmens zu zählen, können wir die Funktion sapply() verwenden:

 #count unique values in each column
sapply(df, function (x) length(unique(x)))

  team points 
     4 7

Aus dem Ergebnis können wir sehen:

  • In der Punktespalte gibt es 7 eindeutige Werte.
  • In der Teamspalte gibt es 4 eindeutige Werte.

Methode 2: Zählen Sie mit dplyr eindeutige Werte in der Spalte

Der folgende Code zeigt, wie die Anzahl der unterschiedlichen Werte in der Punktespalte mithilfe der Funktion n_distinct() aus dem dplyr-Paket gezählt wird:

 library (dplyr)

#count unique values in points column
n_distinct(df$points)

[1] 7

In der Punktespalte gibt es 7 eindeutige Werte.

Um die Anzahl der eindeutigen Werte in jeder Spalte des Datenrahmens zu zählen, können wir die Funktion sapply() verwenden:

 library (dplyr)

#count unique values in each column
sapply(df, function (x) n_distinct(x))

  team points 
     4 7

Aus dem Ergebnis können wir sehen:

  • In der Punktespalte gibt es 7 eindeutige Werte.
  • In der Teamspalte gibt es 4 eindeutige Werte.

Beachten Sie, dass diese Ergebnisse mit denen der Basis-R-Methode übereinstimmen.

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in R ausführen:

So zählen Sie Duplikate in R
So zählen Sie eindeutige Werte nach Gruppen in R
So zählen Sie die Anzahl der NA-Werte in jeder Spalte in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert