Як перетворити список на кадр даних у r


Існує багато випадків, коли вам може знадобитися перетворити список на фрейм даних у R. У цьому підручнику пояснюється три різні способи зробити це.

Спосіб 1: на основі R

У наступному фрагменті коду показано, як перетворити список на кадр даних, використовуючи лише базовий R:

 #create list
my_list <- list(letters[1:5], letters[6:10])
my_list

[[1]]
[1] "a" "b" "c" "d" "e"

[[2]]
[1] "f" "g" "h" "i" "j"

#convert list to data frame
data.frame(t(sapply(my_list,c)))

  X1 X2 X3 X4 X5
1 abcde
2 fghij

У цьому прикладі sapply перетворює список на матрицю, а потім data.frame перетворює матрицю на кадр даних. Кінцевим результатом є кадр даних із двох рядків і п’яти стовпців.

Спосіб 2: DataTable

У наведеному нижче фрагменті коду показано, як перетворити список із двох вкладених списків у фрейм даних із двома рядками та трьома стовпцями за допомогою функції rbindlist бібліотеки data.table :

 #load data.table library
library(data.table)

#create list
my_list <- list(a = list(var1 = 1, var2 = 2, var3 = 3),
                b = list(var1 = 4, var2 = 5, var3 = 6))
my_list 

$a
$a$var1
[1] 1

$a$var2
[1] 2

$a$var3
[1] 3

$b
$b$var1
[1] 4

$b$var2
[1] 5

$b$var3
[1] 6

#convert list to data frame
rbindlist(my_list)

   var1 var2 var3
1:1 2 3
2:4 5 6

Це призводить до таблиці даних із двома рядками та трьома стовпцями. Якщо ви хочете перетворити цю таблицю даних на кадр даних, ви можете просто використати as.data.frame(DT) .

Цей метод перетворює список на кадр даних швидше, ніж попередній метод, якщо ви працюєте з дуже великим набором даних.

Спосіб 3: Dplyr

У наступному фрагменті коду показано, як перетворити список із двох вкладених списків у фрейм даних із двома рядками та трьома стовпцями за допомогою функції bind_rows бібліотеки dplyr :

 #loadlibrary
library(dplyr)

#create list
my_list <- list(a = list(var1 = 1, var2 = 2, var3 = 3),
                b = list(var1 = 4, var2 = 5, var3 = 6))

my_list

$a
$a$var1
[1] 1

$a$var2
[1] 2

$a$var3
[1] 3


$b
$b$var1
[1] 4

$b$var2
[1] 5

$b$var3
[1] 6

#convert list to data frame
bind_rows(my_list)

# A tibble: 2 x 3
   var1 var2 var3
    
1 1 2 3
2 4 5 6

Це призводить до кадру даних з двох рядків і трьох стовпців.

Цей метод також має тенденцію працювати швидше, ніж базовий R під час роботи з великими наборами даних.

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *