Come utilizzare la funzione droplevels in r (con esempi)


La funzione droplevels() in R può essere utilizzata per rimuovere i livelli dei fattori inutilizzati.

Questa funzione è particolarmente utile se vogliamo rimuovere livelli di fattore che non vengono più utilizzati a causa del sottoinsieme di un vettore o frame di dati.

Questa funzione utilizza la seguente sintassi:

abbassare i livelli (x)

dove x è un oggetto da cui rimuovere i livelli di fattore inutilizzati.

Questo tutorial fornisce alcuni esempi di come utilizzare questa funzionalità nella pratica.

Esempio 1: rimuovere i livelli dei fattori inutilizzati in un vettore

Supponiamo di creare un vettore di dati con cinque livelli di fattori. Successivamente, supponiamo di definire un nuovo vettore di dati con solo tre dei cinque livelli di fattori originali.

 #define data with 5 factor levels
data <- factor (c(1, 2, 3, 4, 5))

#define new data as original data minus 4th and 5th factor levels
new_data <- data[-c(4, 5)]

#view new data
new_data

[1] 1 2 3
Levels: 1 2 3 4 5

Sebbene i nuovi dati contengano solo tre fattori, possiamo vedere che contengono ancora i cinque livelli di fattori originali.

Per rimuovere questi livelli di fattore inutilizzati, possiamo utilizzare la funzione droplevels() :

 #drop unused factor levels
new_data < -droplevels (new_data)

#view data
new_data

[1] 1 2 3
Levels: 1 2 3

I nuovi dati ora contengono solo tre livelli di fattori.

Esempio 2: rimuovere i livelli di fattore inutilizzati in un frame di dati

Supponiamo di creare un frame di dati in cui una delle variabili è un fattore a cinque livelli. Successivamente, supponiamo di definire un nuovo frame di dati che rimuove due di questi livelli di fattore:

 #create data frame
df <- data. frame (region= factor (c('A', 'B', 'C', 'D', 'E')),
                 sales = c(13, 16, 22, 27, 34))

#view data frame
df

  regional sales
1 to 13
2 B 16
3 C 22
4 D 27
5 E 34

#define new data frame
new_df <- subset (df, sales < 25)

#view new data frame
new_df

  regional sales
1 to 13
2 B 16
3 C 22

#check levels of region variable
levels (new_df$region)

[1] “A” “B” “C” “D” “E”

Sebbene il nuovo database contenga solo tre fattori nella colonna della regione , contiene ancora i cinque livelli di fattore originali. Ciò creerebbe problemi se provassimo a creare grafici utilizzando questi dati.

Per rimuovere i livelli dei fattori inutilizzati dalla variabile regione , possiamo utilizzare la funzione droplevels() :

 #drop unused factor levels
new_df$region <- droplevels (new_df$region)

#check levels of region variable
levels (new_df$region)

[1] “A” “B” “C”

Ora la variabile regione contiene solo tre livelli di fattori.

Puoi trovare altri tutorial su R in questa pagina .

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *