So verwenden sie die funktion split() in r, um daten aufzuteilen
Die Funktion split() in R kann verwendet werden, um Daten basierend auf Faktorstufen in Gruppen aufzuteilen.
Diese Funktion verwendet die folgende grundlegende Syntax:
teile(x, f, …)
Gold:
- x : Name des Vektors oder Datenblocks, der in Gruppen unterteilt werden soll
- f : Ein Faktor, der die Gruppierungen definiert
Die folgenden Beispiele zeigen, wie Sie diese Funktion verwenden, um Vektoren und Datenrahmen in Gruppen zu unterteilen.
Beispiel 1: Verwenden Sie split(), um den Vektor in Gruppen aufzuteilen
Der folgende Code zeigt, wie ein Vektor von Datenwerten basierend auf einem Vektor von Faktorstufen in Gruppen unterteilt wird:
#create vector of data values data <- c(1, 2, 3, 4, 5, 6) #create vector of groupings groups <- c('A', 'B', 'B', 'B', 'C', 'C') #split vector of data values into groups split(x = data, f = groups) $A [1] 1 $B [1] 2 3 4 $C [1] 5 6
Das Ergebnis sind drei Gruppen.
Beachten Sie, dass Sie die Indizierung auch zum Abrufen bestimmter Gruppen verwenden können:
#split vector of data values into groups and only display second group
split(x = data, f = groups)[2]
$B
[1] 2 3 4
Beispiel 2: Verwenden Sie split(), um den Datenrahmen in Gruppen aufzuteilen
Angenommen, wir haben den folgenden Datenrahmen in R:
#create data frame df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'B'), position=c('G', 'G', 'F', 'G', 'F', 'F'), points=c(33, 28, 31, 39, 34, 44), assists=c(30, 28, 24, 24, 28, 19)) #view data frame df team position points assists 1 GA 33 30 2 AG 28 28 3 AF 31 24 4 BG 39 24 5 BF 34 28 6 BF 44 19
Wir können den folgenden Code verwenden, um den Datenrahmen basierend auf der Variable „team“ in Gruppen zu unterteilen:
#split data frame into groups based on 'team'
split(df, f = df$team)
$A
team position points assists
1 GA 33 30
2 AG 28 28
3 AF 31 24
$B
team position points assists
4 BG 39 24
5 BF 34 28
6 BF 44 19
Das Ergebnis sind zwei Gruppen. Die erste enthält nur Zeilen, in denen „Team“ gleich A ist, und die zweite enthält nur Zeilen, in denen „Team“ gleich B ist.
Beachten Sie, dass wir die Daten auch mithilfe mehrerer Faktorvariablen in Gruppen einteilen können. Der folgende Code zeigt beispielsweise, wie Daten basierend auf den Variablen „Team“ und „Position“ in Gruppen unterteilt werden:
#split data frame into groups based on 'team' and 'position' variables
split(df, f = list(df$team, df$position))
$AF
team position points assists
3 AF 31 24
$BF
team position points assists
5 BF 34 28
6 BF 44 19
$AG
team position points assists
1 GA 33 30
2 AG 28 28
$BG
team position points assists
4 BG 39 24
Das Ergebnis sind vier Gruppen.
Zusätzliche Ressourcen
Die folgenden Tutorials erklären, wie Sie andere gängige Funktionen in R verwenden:
So verwenden Sie die Funktion summary() in R
So verwenden Sie die Funktion „replicate()“ in R
So verwenden Sie die Funktion match() in R