So verwenden sie die funktion split() in r, um daten aufzuteilen


Die Funktion split() in R kann verwendet werden, um Daten basierend auf Faktorstufen in Gruppen aufzuteilen.

Diese Funktion verwendet die folgende grundlegende Syntax:

teile(x, f, …)

Gold:

  • x : Name des Vektors oder Datenblocks, der in Gruppen unterteilt werden soll
  • f : Ein Faktor, der die Gruppierungen definiert

Die folgenden Beispiele zeigen, wie Sie diese Funktion verwenden, um Vektoren und Datenrahmen in Gruppen zu unterteilen.

Beispiel 1: Verwenden Sie split(), um den Vektor in Gruppen aufzuteilen

Der folgende Code zeigt, wie ein Vektor von Datenwerten basierend auf einem Vektor von Faktorstufen in Gruppen unterteilt wird:

 #create vector of data values
data <- c(1, 2, 3, 4, 5, 6)

#create vector of groupings
groups <- c('A', 'B', 'B', 'B', 'C', 'C')

#split vector of data values into groups
split(x = data, f = groups)

$A
[1] 1

$B
[1] 2 3 4

$C
[1] 5 6

Das Ergebnis sind drei Gruppen.

Beachten Sie, dass Sie die Indizierung auch zum Abrufen bestimmter Gruppen verwenden können:

 #split vector of data values into groups and only display second group
split(x = data, f = groups)[2]

$B
[1] 2 3 4

Beispiel 2: Verwenden Sie split(), um den Datenrahmen in Gruppen aufzuteilen

Angenommen, wir haben den folgenden Datenrahmen in R:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'B'),
                 position=c('G', 'G', 'F', 'G', 'F', 'F'),
                 points=c(33, 28, 31, 39, 34, 44),
                 assists=c(30, 28, 24, 24, 28, 19))

#view data frame
df

  team position points assists
1 GA 33 30
2 AG 28 28
3 AF 31 24
4 BG 39 24
5 BF 34 28
6 BF 44 19

Wir können den folgenden Code verwenden, um den Datenrahmen basierend auf der Variable „team“ in Gruppen zu unterteilen:

 #split data frame into groups based on 'team'
split(df, f = df$team)

$A
  team position points assists
1 GA 33 30
2 AG 28 28
3 AF 31 24

$B
  team position points assists
4 BG 39 24
5 BF 34 28
6 BF 44 19

Das Ergebnis sind zwei Gruppen. Die erste enthält nur Zeilen, in denen „Team“ gleich A ist, und die zweite enthält nur Zeilen, in denen „Team“ gleich B ist.

Beachten Sie, dass wir die Daten auch mithilfe mehrerer Faktorvariablen in Gruppen einteilen können. Der folgende Code zeigt beispielsweise, wie Daten basierend auf den Variablen „Team“ und „Position“ in Gruppen unterteilt werden:

 #split data frame into groups based on 'team' and 'position' variables
split(df, f = list(df$team, df$position))

$AF
  team position points assists
3 AF 31 24

$BF
  team position points assists
5 BF 34 28
6 BF 44 19

$AG
  team position points assists
1 GA 33 30
2 AG 28 28

$BG
  team position points assists
4 BG 39 24

Das Ergebnis sind vier Gruppen.

Zusätzliche Ressourcen

Die folgenden Tutorials erklären, wie Sie andere gängige Funktionen in R verwenden:

So verwenden Sie die Funktion summary() in R
So verwenden Sie die Funktion „replicate()“ in R
So verwenden Sie die Funktion match() in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert