So verwenden sie die droplevels-funktion in r (mit beispielen)


Mit der Funktion droplevels() in R können ungenutzte Faktorstufen entfernt werden.

Diese Funktion ist besonders nützlich, wenn wir Faktorstufen entfernen möchten, die aufgrund einer Teilmenge eines Vektors oder Datenrahmens nicht mehr verwendet werden.

Diese Funktion verwendet die folgende Syntax:

Drop-Level (x)

Dabei ist x ein Objekt, aus dem ungenutzte Faktorstufen entfernt werden sollen.

Dieses Tutorial enthält einige Beispiele für die praktische Verwendung dieser Funktion.

Beispiel 1: Nicht verwendete Faktorstufen in einem Vektor entfernen

Angenommen, wir erstellen einen Datenvektor mit fünf Faktorstufen. Nehmen wir als Nächstes an, wir definieren einen neuen Datenvektor mit nur drei der ursprünglichen fünf Faktorstufen.

 #define data with 5 factor levels
data <- factor (c(1, 2, 3, 4, 5))

#define new data as original data minus 4th and 5th factor levels
new_data <- data[-c(4, 5)]

#view new data
new_data

[1] 1 2 3
Levels: 1 2 3 4 5

Obwohl die neuen Daten nur drei Faktoren enthalten, können wir sehen, dass sie immer noch die ursprünglichen fünf Faktorstufen enthalten.

Um diese nicht verwendeten Faktorstufen zu entfernen, können wir die Funktion droplevels() verwenden:

 #drop unused factor levels
new_data < -droplevels (new_data)

#view data
new_data

[1] 1 2 3
Levels: 1 2 3

Die neuen Daten enthalten jetzt nur noch drei Ebenen von Faktoren.

Beispiel 2: Entfernen Sie nicht verwendete Faktorstufen in einem Datenrahmen

Angenommen, wir erstellen einen Datenrahmen, in dem eine der Variablen ein fünfstufiger Faktor ist. Nehmen wir als Nächstes an, wir definieren einen neuen Datenrahmen, der zwei dieser Faktorstufen entfernt:

 #create data frame
df <- data. frame (region= factor (c('A', 'B', 'C', 'D', 'E')),
                 sales = c(13, 16, 22, 27, 34))

#view data frame
df

  regional sales
1 to 13
2 B 16
3 C 22
4 D 27
5 E 34

#define new data frame
new_df <- subset (df, sales < 25)

#view new data frame
new_df

  regional sales
1 to 13
2 B 16
3 C 22

#check levels of region variable
levels (new_df$region)

[1] “A” “B” “C” “D” “E”

Obwohl die neue Datenbank nur drei Faktoren in der Regionsspalte enthält, enthält sie immer noch die ursprünglichen fünf Faktorstufen. Dies würde zu Problemen führen, wenn wir versuchen würden, anhand dieser Daten Diagramme zu erstellen.

Um nicht verwendete Faktorstufen aus der Regionsvariablen zu entfernen, können wir die Funktion droplevels() verwenden:

 #drop unused factor levels
new_df$region <- droplevels (new_df$region)

#check levels of region variable
levels (new_df$region)

[1] “A” “B” “C”

Jetzt enthält die Regionsvariable nur noch drei Ebenen von Faktoren.

Weitere R-Tutorials finden Sie auf dieser Seite .

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert