So verwenden sie die funktion cut() in r


Die Funktion cut() in R kann verwendet werden, um einen Wertebereich in Bins zu unterteilen und Beschriftungen für jedes Bin anzugeben.

Diese Funktion verwendet die folgende Syntax:

cut(x, breaks, labels = NULL, …)

Gold:

  • x : Vektorname
  • breaks : Anzahl der vorzunehmenden Unterbrechungen oder Vektor der Unterbrechungspunkte
  • Etiketten : Etiketten für die resultierenden Behälter

Die folgenden Beispiele zeigen, wie diese Funktion in verschiedenen Szenarien mit dem folgenden Datenrahmen in R verwendet wird:

 #create data frame
df <- data. frame (player=c('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I'),
                 points=c(4, 7, 8, 12, 14, 16, 20, 26, 36))

#view data frame
df

  player points
1 to 4
2 B 7
3 C 8
4 D 12
5 E 14
6 F 16
7 G 20
8:26 a.m.
9 I 36

Beispiel 1: Schneiden Sie den Vektor basierend auf der Anzahl der Unterbrechungen

Der folgende Code zeigt, wie Sie mit der Funktion „cut()“ eine neue Spalte namens „ Kategorie“ erstellen, die die Punktespalte in Gruppen von vier gleich großen Gruppen unterteilt:

 #create new column that places each player into four categories based on points
df$category <- cut(df$points, breaks= 4 )

#view updated data frame
df

  player points category
1 to 4 (3.97.12]
2 B 7 (3.97.12]
3 C 8 (3.97.12]
4 D 12 (3.97.12]
5 E 14 (12.20]
6 F 16 (12.20]
7 G 20 (12.20]
8:26 a.m. (20.28]
9 I 36 (28.36]

Da wir breaks=4 angegeben haben, teilt die Funktion cut() die Werte in der Punktspalte in Gruppen von vier gleich großen Gruppen auf.

So hat die Funktion cut() das gemacht:

  • Zunächst ermittelte er die Differenz zwischen dem größten und dem kleinsten Wert in der Punktespalte (36 – 4 = 32).
  • Dann dividiert er diese Differenz durch 4 (32 / 4 = 8)
  • Das Ergebnis sind vier Bins mit einer Breite von jeweils 8.

Hinweis : Das niedrigste Intervall beträgt 3,97 statt 4 aufgrund der folgenden Funktionalität aus der Dokumentation zu cut() :

Wenn Pausen als einzelne Zahl angegeben werden, wird der Datenbereich in Pausenabschnitte gleicher Länge unterteilt. Anschließend werden die äußeren Grenzen um 0,1 % vom Bereich entfernt verschoben, um sicherzustellen, dass die Ausreißer in beide Pausenintervalle fallen.

Beispiel 2: Schnittvektor basierend auf bestimmten Haltepunkten

Der folgende Code zeigt, wie Sie mit der Funktion „cut()“ eine neue Spalte namens „ Kategorie“ erstellen, die die Punktespalte basierend auf einem Vektor bestimmter Haltepunkte schneidet:

 #create new column based on specific break points
df$category <- cut(df$points, breaks=c(0, 10, 15, 20, 40))

#view updated data frame
df

  player points category
1 to 4 (0.10]
2 B 7 (0.10]
3 C 8 (0.10]
4 D 12 (10.15]
5 E 14 (10.15]
6 F 16 (15.20]
7 G 20 (15.20]
8:26 a.m. (20.40)
9 I 36 (20.40]

Die Funktion „cut()“ klassifizierte jeden Spieler anhand des von uns bereitgestellten spezifischen Vektors von Haltepunkten in Kategorien.

Beispiel 3: Schneiden Sie einen Vektor mithilfe bestimmter Haltepunkte und Beschriftungen aus

Der folgende Code zeigt, wie Sie mit der Funktion „cut()“ eine neue Spalte namens „ Kategorie“ erstellen, die die Punktespalte basierend auf einem Vektor bestimmter Haltepunkte mit benutzerdefinierten Beschriftungen schneidet:

 #create new column based on values in points column
df$category <- cut(df$points,
                   breaks=c(0, 10, 15, 20, 40),
                   labels=c(' Bad ', ' OK ', ' Good ', ' Great '))

#view updated data frame
df

  player points category
1 A 4 Bad
2 B 7 Bad
3 C 8 Bad
4 D 12 OK
5 E 14 OK
6 F 16 Good
7 G 20 Good
8:26 A.M. Great
9 I 36 Great

In der neuen Kategoriespalte wird jeder Spieler basierend auf dem entsprechenden Wert in der Punktespalte als „Schlecht“, „OK“, „Gut“ oder „Ausgezeichnet“ eingestuft.

Hinweis : Die Anzahl der Beschriftungen muss immer um eins kleiner sein als die Anzahl der Haltepunkte, um den folgenden Fehler zu vermeiden:

 Error in cut.default(df$points, breaks = c(0, 10, 15, 20, 40), labels = c("Bad",: 
  lengths of 'breaks' and 'labels' differ

Zusätzliche Ressourcen

Die folgenden Tutorials erklären, wie Sie andere gängige Funktionen in R verwenden:

So verwenden Sie die Funktion tabulate() in R
So verwenden Sie die Funktion split() in R
So verwenden Sie die Funktion match() in R
So verwenden Sie die Funktion „replicate()“ in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert