Jak korzystać z funkcji droplevels w r (z przykładami)


Funkcji droplevels() w R można użyć do usunięcia nieużywanych poziomów czynników.

Ta funkcja jest szczególnie przydatna, jeśli chcemy usunąć poziomy współczynników, które nie są już używane ze względu na podzbiór wektora lub ramki danych.

Ta funkcja używa następującej składni:

poziomy spadku (x)

gdzie x jest obiektem, z którego należy usunąć niewykorzystane poziomy współczynników.

W tym samouczku przedstawiono kilka przykładów wykorzystania tej funkcji w praktyce.

Przykład 1: Usuń nieużywane poziomy czynników w wektorze

Załóżmy, że tworzymy wektor danych z pięcioma poziomami czynników. Następnie załóżmy, że definiujemy nowy wektor danych zawierający tylko trzy z pierwotnych pięciu poziomów współczynników.

 #define data with 5 factor levels
data <- factor (c(1, 2, 3, 4, 5))

#define new data as original data minus 4th and 5th factor levels
new_data <- data[-c(4, 5)]

#view new data
new_data

[1] 1 2 3
Levels: 1 2 3 4 5

Chociaż nowe dane zawierają tylko trzy czynniki, widzimy, że nadal zawierają pierwotne poziomy pięciu czynników.

Aby usunąć te nieużywane poziomy czynników, możemy użyć funkcji droplevels() :

 #drop unused factor levels
new_data < -droplevels (new_data)

#view data
new_data

[1] 1 2 3
Levels: 1 2 3

Nowe dane obejmują obecnie tylko trzy poziomy czynników.

Przykład 2: Usuń nieużywane poziomy współczynników w ramce danych

Załóżmy, że tworzymy ramkę danych, w której jedna ze zmiennych jest współczynnikiem pięciopoziomowym. Następnie załóżmy, że definiujemy nową ramkę danych, która usuwa dwa z następujących poziomów współczynników:

 #create data frame
df <- data. frame (region= factor (c('A', 'B', 'C', 'D', 'E')),
                 sales = c(13, 16, 22, 27, 34))

#view data frame
df

  regional sales
1 to 13
2 B 16
3 C 22
4 D 27
5 E 34

#define new data frame
new_df <- subset (df, sales < 25)

#view new data frame
new_df

  regional sales
1 to 13
2 B 16
3 C 22

#check levels of region variable
levels (new_df$region)

[1] “A” “B” “C” “D” “E”

Chociaż nowa baza danych zawiera tylko trzy współczynniki w kolumnie regionu , nadal zawiera pierwotne pięć poziomów współczynników. Stworzyłoby to problemy, gdybyśmy próbowali tworzyć wykresy przy użyciu tych danych.

Aby usunąć nieużywane poziomy czynników ze zmiennej regionu , możemy użyć funkcji droplevels() :

 #drop unused factor levels
new_df$region <- droplevels (new_df$region)

#check levels of region variable
levels (new_df$region)

[1] “A” “B” “C”

Teraz zmienna regionu zawiera tylko trzy poziomy czynników.

Więcej samouczków dotyczących języka R można znaleźć na tej stronie .

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *