如何使用colclasses快速导入数据到r中


将文件导入 R 时,可以使用colClasses参数来指定每列的类:

 df <- read. csv (' my_data.csv ',
               colClasses=c(' character ', ' numeric ', ' numeric '))

使用colClasses的优点是可以更快地导入数据,尤其是当文件非常大时。

下面的例子展示了如何在实践中使用这个参数。

示例:导入文件时使用 colClasses

假设我有一个名为my_data.csv的 CSV 文件,其中包含三列,我想将其导入到 R 中:

我可以使用以下语法来执行此操作:

 #import CSV file
df <- read. csv (' my_data.csv ',
               colClasses=c(' character ', ' numeric ', ' numeric '))

#view class of each column in data frame
str(df)

'data.frame': 14 obs. of 3 variables:
 $ team: chr "Mavs" "Spurs" "Hornets" "Rockets" ...
 $ points: num 91 99 104 103 105 88 89 93 96 99 ...
 $rebounds: num 33 23 26 25 25 26 29 30 34 23 ...

请注意, colClasses参数中的值的数量必须与数据框中的列数匹配。

例如,如果您只为colClasses参数提供一个值,则数据框中的每一列将具有相同的类:

 #import CSV file
df <- read. csv (' my_data.csv ',
               colClasses=c(' character '))

#view class of each column in data frame
str(df)

'data.frame': 14 obs. of 3 variables:
 $ team: chr "Mavs" "Spurs" "Hornets" "Rockets" ...
 $ points: chr "91" "99" "104" "103" ...
 $rebounds: chr "33" "23" "26" "25" ...

请注意,结果数据框中的每一列都有一个“字符”类,因为我们只向colClasses参数提供单个值。

请注意,您可以在colClasses参数中指定以下潜在类:

  • 角色:“嘿”、“那里”、“世界”
  • 复杂: as.complex(-1), 4i
  • 数字:as.integer(20), 3L
  • 整数:4、12、158
  • 逻辑:真、假

其他资源

以下教程解释了如何在 R 中执行其他常见操作:

如何在R中手动输入原始数据
如何将 CSV 文件导入到 R 中
如何将Excel文件导入到R中

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注