So teilen sie daten in r in gleich große gruppen auf


Sie können die Funktion cut_number() des Pakets ggplot2 in R verwenden, um einen Vektor in gleich große Gruppen zu unterteilen.

Diese Funktion verwendet die folgende grundlegende Syntax:

Schnittnummer(x,n)

Gold:

  • x: Name des zu dividierenden digitalen Vektors
  • n: Anzahl der Gruppen

Das folgende Beispiel zeigt, wie Sie diese Funktion in der Praxis nutzen können.

Beispiel: Wie man Daten in R in Gruppen gleicher Größe aufteilt

Angenommen, wir haben den folgenden Datenrahmen in R, der Informationen über die von 12 verschiedenen Basketballspielern erzielten Punkte enthält

 #create data frame
df <- data. frame (player=LETTERS[1:12],
                 points=c(1, 2, 2, 2, 4, 5, 7, 9, 12, 14, 15, 22))

#view data frame
df

   player points
1 to 1
2 B 2
3 C 2
4 D 2
5 E 4
6 F 5
7 G 7
8:9 a.m.
9 I 12
10 D 14
11K15
12 L 22

Verwandt: So verwenden Sie die LETTERS-Funktion in R

Wir können die Funktion „cut_number()“ aus dem Paket „ggplot2“ verwenden, um eine neue Spalte namens „ group “ zu erstellen, die jede Zeile des Datenrahmens basierend auf dem Wert in der Punktespalte in eine von drei Gruppen unterteilt:

 library (ggplot2)

#create new column that splits data into three equal sized groups based on points
df$group <- cut_number(df$points, 3)

#view updated data frame
df

   player points group
1 To 1 [1,3.33]
2 B 2 [1,3.33]
3 C 2 [1,3.33]
4 D 2 [1,3.33]
5 E 4 (3.33.10]
6 F 5 (3.33.10]
7 G 7 (3.33.10]
8 A.M. 9 (3.33.10]
9 I 12 (10.22]
10 J 14 (10.22]
11 K 15 (10.22]
12 L 22 (10.22]

Jeder der 12 Spieler wurde basierend auf dem in der Punktespalte angezeigten Wert in eine von drei Gruppen eingeteilt.

Aus dem Ergebnis können wir erkennen, dass es drei verschiedene Gruppen gibt:

  • Gruppe 1: Der Wert der Punkte liegt zwischen 1 und 3,33.
  • Gruppe 2: Der Wert der Punkte liegt zwischen 3,33 und 10.
  • Gruppe 3: Der Wert der Punkte liegt zwischen 10 und 22.

Wir können sehen, dass in jeder Gruppe vier Spieler platziert wurden.

Wenn Sie möchten, dass die Gruppenspalte die Gruppen als Ganzzahlwerte anzeigt, können Sie die Funktion „cut_number()“ in eine Funktion „as.numeric()“ einbinden:

 library (ggplot2)

#create new column that splits data into three equal sized groups based on points
df$group <- as. numeric (cut_number(df$points, 3))

#view updated data frame
df

   player points group
1 A 1 1
2 B 2 1
3 C 2 1
4 D 2 1
5 E 4 2
6 F 5 2
7 G 7 2
8:92 a.m.
9 I 12 3
10 D 14 3
11 K 15 3
12 L 22 3

Die neue Gruppenspalte enthält nun die Werte 1, 2 und 3, um anzuzeigen, zu welcher Gruppe der Spieler gehört.

Auch hier besteht jede Gruppe aus vier Spielern.

Hinweis : Um die Punktspalte in mehr als drei Gruppen aufzuteilen, ersetzen Sie einfach die 3 in der Funktion „cut_number()“ durch eine andere Zahl.

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in R ausführen:

So teilen Sie einen Datenrahmen in R
So teilen Sie Daten in Trainings- und Testsätze in R auf
So führen Sie eine Datengruppierung in R durch

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert