So verwenden sie die unite-funktion in r (mit beispielen)
Mit der Funktion „unit()“ des Tidyr- Pakets können mehrere Datenrahmenspalten in einer einzigen Spalte zusammengefasst werden.
Diese Funktion verwendet die folgende grundlegende Syntax:
Einheit(Daten, Spalte, in, sep)
Gold:
- data : Name des Datenrahmens
- col : Name der neuen einfachen Spalte
- … : Vektor der Namen für die zu verbindenden Spalten
- sep : So verknüpfen Sie Daten in einer neuen gemeinsamen Spalte
Die folgenden Beispiele zeigen, wie Sie diese Funktion in der Praxis nutzen können.
Beispiel 1: Vereinen Sie zwei Spalten zu einer einzigen Spalte
Angenommen, wir haben den folgenden Datenrahmen in R:
#create data frame df <- data. frame (player=c('A', 'A', 'B', 'B', 'C', 'C'), year=c(1, 2, 1, 2, 1, 2), dots=c(22, 29, 18, 11, 12, 19), assists=c(2, 3, 6, 8, 5, 2)) #view data frame df player year points assists 1 A 1 22 2 2 A 2 29 3 3 B 1 18 6 4 B 2 11 8 5 C 1 12 5 6 C 2 19 2
Mit der Funktion „unit()“ können wir die Spalten „Punkte“ und „Unterstützungen“ in einer einzigen Spalte zusammenfassen:
library (tidyr) #unite points and assists columns into single column unit(df, col=' points-assists ', c(' points ', ' assists '), sep=' - ') player year points assists 1 A 1 22-2 2 A 2 29-3 3 B 1 18-6 4 B 2 11-8 5 C 1 12-5 6 C 2 19-2
Beispiel 2: Verbinden von mehr als zwei Spalten
Angenommen, wir haben den folgenden Datenrahmen in R:
#create data frame df2 <- data. frame (player=c('A', 'A', 'B', 'B', 'C', 'C'), year=c(1, 2, 1, 2, 1, 2), dots=c(22, 29, 18, 11, 12, 19), assists=c(2, 3, 6, 8, 5, 2), blocks=c(2, 3, 3, 2, 1, 0)) #view data frame df2 player year points assists blocks 1 A 1 22 2 2 2 A 2 29 3 3 3 B 1 18 6 3 4 B 2 11 8 2 5 C 1 12 5 1 6 C 2 19 2 0
Wir können die Funktion „unit()“ verwenden, um die Punkte-, Assists- und Block-Spalten in einer einzigen Spalte zu vereinen:
library (tidyr) #unite points, assists, and blocks column into single column unit(df2, col=' stats ', c(' points ', ' assists ', ' blocks '), sep=' / ') player year stats 1 A 1 22/2/2 2 to 2 3/29/3 3 B 1 18/6/3 4 B 2 11/8/2 5 C 1 12/5/1 6 C 2 19/2/0
Zusätzliche Ressourcen
Das Ziel des Tidyr- Pakets besteht darin, „aufgeräumte“ Daten zu erstellen, die folgende Eigenschaften aufweisen:
- Jede Spalte ist eine Variable.
- Jede Zeile ist eine Beobachtung.
- Jede Zelle ist ein eindeutiger Wert.
Das Tidyr-Paket verwendet vier Hauptfunktionen zum Erstellen geordneter Daten:
1. Die Funktion spread() .
2. Die Funktion „gather()“ .
3. Die Funktion „separate()“ .
4. Die Unit() -Funktion.
Wenn Sie diese vier Funktionen beherrschen, können Sie aus jedem Datenrahmen „aufgeräumte“ Daten erstellen.