So verwenden sie die unite-funktion in r (mit beispielen)


Mit der Funktion „unit()“ des Tidyr- Pakets können mehrere Datenrahmenspalten in einer einzigen Spalte zusammengefasst werden.

Diese Funktion verwendet die folgende grundlegende Syntax:

Einheit(Daten, Spalte, in, sep)

Gold:

  • data : Name des Datenrahmens
  • col : Name der neuen einfachen Spalte
  • : Vektor der Namen für die zu verbindenden Spalten
  • sep : So verknüpfen Sie Daten in einer neuen gemeinsamen Spalte

Die folgenden Beispiele zeigen, wie Sie diese Funktion in der Praxis nutzen können.

Beispiel 1: Vereinen Sie zwei Spalten zu einer einzigen Spalte

Angenommen, wir haben den folgenden Datenrahmen in R:

 #create data frame
df <- data. frame (player=c('A', 'A', 'B', 'B', 'C', 'C'),
                 year=c(1, 2, 1, 2, 1, 2),
                 dots=c(22, 29, 18, 11, 12, 19),
                 assists=c(2, 3, 6, 8, 5, 2))

#view data frame
df

  player year points assists
1 A 1 22 2
2 A 2 29 3
3 B 1 18 6
4 B 2 11 8
5 C 1 12 5
6 C 2 19 2

Mit der Funktion „unit()“ können wir die Spalten „Punkte“ und „Unterstützungen“ in einer einzigen Spalte zusammenfassen:

 library (tidyr)

#unite points and assists columns into single column
unit(df, col=' points-assists ', c(' points ', ' assists '), sep=' - ')

  player year points assists
1 A 1 22-2
2 A 2 29-3
3 B 1 18-6
4 B 2 11-8
5 C 1 12-5
6 C 2 19-2

Beispiel 2: Verbinden von mehr als zwei Spalten

Angenommen, wir haben den folgenden Datenrahmen in R:

 #create data frame
df2 <- data. frame (player=c('A', 'A', 'B', 'B', 'C', 'C'),
                  year=c(1, 2, 1, 2, 1, 2),
                  dots=c(22, 29, 18, 11, 12, 19),
                  assists=c(2, 3, 6, 8, 5, 2),
                  blocks=c(2, 3, 3, 2, 1, 0))

#view data frame
df2

  player year points assists blocks
1 A 1 22 2 2
2 A 2 29 3 3
3 B 1 18 6 3
4 B 2 11 8 2
5 C 1 12 5 1
6 C 2 19 2 0

Wir können die Funktion „unit()“ verwenden, um die Punkte-, Assists- und Block-Spalten in einer einzigen Spalte zu vereinen:

 library (tidyr)

#unite points, assists, and blocks column into single column
unit(df2, col=' stats ', c(' points ', ' assists ', ' blocks '), sep=' / ')

  player year stats
1 A 1 22/2/2
2 to 2 3/29/3
3 B 1 18/6/3
4 B 2 11/8/2
5 C 1 12/5/1
6 C 2 19/2/0

Zusätzliche Ressourcen

Das Ziel des Tidyr- Pakets besteht darin, „aufgeräumte“ Daten zu erstellen, die folgende Eigenschaften aufweisen:

  • Jede Spalte ist eine Variable.
  • Jede Zeile ist eine Beobachtung.
  • Jede Zelle ist ein eindeutiger Wert.

Das Tidyr-Paket verwendet vier Hauptfunktionen zum Erstellen geordneter Daten:

1. Die Funktion spread() .

2. Die Funktion „gather()“ .

3. Die Funktion „separate()“ .

4. Die Unit() -Funktion.

Wenn Sie diese vier Funktionen beherrschen, können Sie aus jedem Datenrahmen „aufgeräumte“ Daten erstellen.

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert