So verwenden sie die droplevels-funktion in r (mit beispielen)
Mit der Funktion droplevels() in R können ungenutzte Faktorstufen entfernt werden.
Diese Funktion ist besonders nützlich, wenn wir Faktorstufen entfernen möchten, die aufgrund einer Teilmenge eines Vektors oder Datenrahmens nicht mehr verwendet werden.
Diese Funktion verwendet die folgende Syntax:
Drop-Level (x)
Dabei ist x ein Objekt, aus dem ungenutzte Faktorstufen entfernt werden sollen.
Dieses Tutorial enthält einige Beispiele für die praktische Verwendung dieser Funktion.
Beispiel 1: Nicht verwendete Faktorstufen in einem Vektor entfernen
Angenommen, wir erstellen einen Datenvektor mit fünf Faktorstufen. Nehmen wir als Nächstes an, wir definieren einen neuen Datenvektor mit nur drei der ursprünglichen fünf Faktorstufen.
#define data with 5 factor levels data <- factor (c(1, 2, 3, 4, 5)) #define new data as original data minus 4th and 5th factor levels new_data <- data[-c(4, 5)] #view new data new_data [1] 1 2 3 Levels: 1 2 3 4 5
Obwohl die neuen Daten nur drei Faktoren enthalten, können wir sehen, dass sie immer noch die ursprünglichen fünf Faktorstufen enthalten.
Um diese nicht verwendeten Faktorstufen zu entfernen, können wir die Funktion droplevels() verwenden:
#drop unused factor levels new_data < -droplevels (new_data) #view data new_data [1] 1 2 3 Levels: 1 2 3
Die neuen Daten enthalten jetzt nur noch drei Ebenen von Faktoren.
Beispiel 2: Entfernen Sie nicht verwendete Faktorstufen in einem Datenrahmen
Angenommen, wir erstellen einen Datenrahmen, in dem eine der Variablen ein fünfstufiger Faktor ist. Nehmen wir als Nächstes an, wir definieren einen neuen Datenrahmen, der zwei dieser Faktorstufen entfernt:
#create data frame df <- data. frame (region= factor (c('A', 'B', 'C', 'D', 'E')), sales = c(13, 16, 22, 27, 34)) #view data frame df regional sales 1 to 13 2 B 16 3 C 22 4 D 27 5 E 34 #define new data frame new_df <- subset (df, sales < 25) #view new data frame new_df regional sales 1 to 13 2 B 16 3 C 22 #check levels of region variable levels (new_df$region) [1] “A” “B” “C” “D” “E”
Obwohl die neue Datenbank nur drei Faktoren in der Regionsspalte enthält, enthält sie immer noch die ursprünglichen fünf Faktorstufen. Dies würde zu Problemen führen, wenn wir versuchen würden, anhand dieser Daten Diagramme zu erstellen.
Um nicht verwendete Faktorstufen aus der Regionsvariablen zu entfernen, können wir die Funktion droplevels() verwenden:
#drop unused factor levels new_df$region <- droplevels (new_df$region) #check levels of region variable levels (new_df$region) [1] “A” “B” “C”
Jetzt enthält die Regionsvariable nur noch drei Ebenen von Faktoren.
Weitere R-Tutorials finden Sie auf dieser Seite .