So verwenden sie die gather-funktion in r (mit beispielen)
Mit der Funktion „gather()“ aus dem Tidyr- Paket kann ein Schlüssel-Wert-Paar über mehrere Spalten hinweg „gesammelt“ werden.
Diese Funktion verwendet die folgende grundlegende Syntax:
sammeln (Daten, Schlüsselwert usw.)
Gold:
- data : Name des Datenrahmens
- Schlüssel : Name der zu erstellenden Schlüsselspalte
- value : Name der zu erstellenden Wertespalte
- … : Geben Sie die Spalten an, aus denen gesammelt werden soll
Die folgenden Beispiele zeigen, wie Sie diese Funktion in der Praxis nutzen können.
Beispiel 1: Erfassen Sie die Werte von zwei Spalten
Angenommen, wir haben den folgenden Datenrahmen in R:
#create data frame df <- data. frame (player=c('A', 'B', 'C', 'D'), year1=c(12, 15, 19, 19), year2=c(22, 29, 18, 12)) #view data frame df player year1 year2 1 to 12 22 2 B 15 29 3 C 19 18 4 D 19 12
Mit der Funktion „gather()“ können wir wie folgt zwei neue Spalten mit den Namen „Jahr“ und „Punkte“ erstellen:
library (tidyr) #gather data from columns 2 and 3 gather(df, key=" year ", value=" points ", 2:3) player year points 1 A year1 12 2 B year1 15 3 C year1 19 4 D year1 19 5 A year2 22 6 B year2 29 7 C year2 18 8 D year2 12
Beispiel 2: Erfassen Sie Werte aus mehr als zwei Spalten
Angenommen, wir haben den folgenden Datenrahmen in R:
#create data frame df2 <- data. frame (player=c('A', 'B', 'C', 'D'), year1=c(12, 15, 19, 19), year2=c(22, 29, 18, 12), year3=c(17, 17, 22, 25)) #view data frame df2 player year1 year2 year3 1 A 12 22 17 2 B 15 29 17 3 C 19 18 22 4 D 19 12 25
Wir können die Funktion „ gather() “ verwenden, um die Werte aus den Spalten 2, 3 und 4 in zwei neuen Spalten mit den Namen „Jahr“ und „Punkte“ wie folgt zu „sammeln“:
library (tidyr) #gather data from columns 2, 3, and 4 gather(df, key=" year ", value=" points ", 2:4) player year points 1 A year1 12 2 B year1 15 3 C year1 19 4 D year1 19 5 A year2 22 6 B year2 29 7 C year2 18 8 D year2 12 9 A year3 17 10 B year3 17 11 C year3 22 12 D year3 25
Zusätzliche Ressourcen
Das Ziel des Tidyr- Pakets besteht darin, „aufgeräumte“ Daten zu erstellen, die folgende Eigenschaften aufweisen:
- Jede Spalte ist eine Variable.
- Jede Zeile ist eine Beobachtung.
- Jede Zelle ist ein einzigartiger Wert.
Das Tidyr-Paket verwendet vier Hauptfunktionen zum Erstellen geordneter Daten:
1. Die Funktion spread() .
2. Die Funktion „gather()“ .
3. Die Funktion „separate()“ .
4. Die Unit() -Funktion.
Wenn Sie diese vier Funktionen beherrschen, können Sie aus jedem Datenrahmen „aufgeräumte“ Daten erstellen.