So teilen sie daten in r in gleich große gruppen auf
Sie können die Funktion cut_number() des Pakets ggplot2 in R verwenden, um einen Vektor in gleich große Gruppen zu unterteilen.
Diese Funktion verwendet die folgende grundlegende Syntax:
Schnittnummer(x,n)
Gold:
- x: Name des zu dividierenden digitalen Vektors
- n: Anzahl der Gruppen
Das folgende Beispiel zeigt, wie Sie diese Funktion in der Praxis nutzen können.
Beispiel: Wie man Daten in R in Gruppen gleicher Größe aufteilt
Angenommen, wir haben den folgenden Datenrahmen in R, der Informationen über die von 12 verschiedenen Basketballspielern erzielten Punkte enthält
#create data frame df <- data. frame (player=LETTERS[1:12], points=c(1, 2, 2, 2, 4, 5, 7, 9, 12, 14, 15, 22)) #view data frame df player points 1 to 1 2 B 2 3 C 2 4 D 2 5 E 4 6 F 5 7 G 7 8:9 a.m. 9 I 12 10 D 14 11K15 12 L 22
Verwandt: So verwenden Sie die LETTERS-Funktion in R
Wir können die Funktion „cut_number()“ aus dem Paket „ggplot2“ verwenden, um eine neue Spalte namens „ group “ zu erstellen, die jede Zeile des Datenrahmens basierend auf dem Wert in der Punktespalte in eine von drei Gruppen unterteilt:
library (ggplot2) #create new column that splits data into three equal sized groups based on points df$group <- cut_number(df$points, 3) #view updated data frame df player points group 1 To 1 [1,3.33] 2 B 2 [1,3.33] 3 C 2 [1,3.33] 4 D 2 [1,3.33] 5 E 4 (3.33.10] 6 F 5 (3.33.10] 7 G 7 (3.33.10] 8 A.M. 9 (3.33.10] 9 I 12 (10.22] 10 J 14 (10.22] 11 K 15 (10.22] 12 L 22 (10.22]
Jeder der 12 Spieler wurde basierend auf dem in der Punktespalte angezeigten Wert in eine von drei Gruppen eingeteilt.
Aus dem Ergebnis können wir erkennen, dass es drei verschiedene Gruppen gibt:
- Gruppe 1: Der Wert der Punkte liegt zwischen 1 und 3,33.
- Gruppe 2: Der Wert der Punkte liegt zwischen 3,33 und 10.
- Gruppe 3: Der Wert der Punkte liegt zwischen 10 und 22.
Wir können sehen, dass in jeder Gruppe vier Spieler platziert wurden.
Wenn Sie möchten, dass die Gruppenspalte die Gruppen als Ganzzahlwerte anzeigt, können Sie die Funktion „cut_number()“ in eine Funktion „as.numeric()“ einbinden:
library (ggplot2) #create new column that splits data into three equal sized groups based on points df$group <- as. numeric (cut_number(df$points, 3)) #view updated data frame df player points group 1 A 1 1 2 B 2 1 3 C 2 1 4 D 2 1 5 E 4 2 6 F 5 2 7 G 7 2 8:92 a.m. 9 I 12 3 10 D 14 3 11 K 15 3 12 L 22 3
Die neue Gruppenspalte enthält nun die Werte 1, 2 und 3, um anzuzeigen, zu welcher Gruppe der Spieler gehört.
Auch hier besteht jede Gruppe aus vier Spielern.
Hinweis : Um die Punktspalte in mehr als drei Gruppen aufzuteilen, ersetzen Sie einfach die 3 in der Funktion „cut_number()“ durch eine andere Zahl.
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in R ausführen:
So teilen Sie einen Datenrahmen in R
So teilen Sie Daten in Trainings- und Testsätze in R auf
So führen Sie eine Datengruppierung in R durch