如何使用colclasses快速导入数据到r中
将文件导入 R 时,可以使用colClasses参数来指定每列的类:
df <- read. csv (' my_data.csv ', colClasses=c(' character ', ' numeric ', ' numeric '))
使用colClasses的优点是可以更快地导入数据,尤其是当文件非常大时。
下面的例子展示了如何在实践中使用这个参数。
示例:导入文件时使用 colClasses
假设我有一个名为my_data.csv的 CSV 文件,其中包含三列,我想将其导入到 R 中:
我可以使用以下语法来执行此操作:
#import CSV file
df <- read. csv (' my_data.csv ',
colClasses=c(' character ', ' numeric ', ' numeric '))
#view class of each column in data frame
str(df)
'data.frame': 14 obs. of 3 variables:
$ team: chr "Mavs" "Spurs" "Hornets" "Rockets" ...
$ points: num 91 99 104 103 105 88 89 93 96 99 ...
$rebounds: num 33 23 26 25 25 26 29 30 34 23 ...
请注意, colClasses参数中的值的数量必须与数据框中的列数匹配。
例如,如果您只为colClasses参数提供一个值,则数据框中的每一列将具有相同的类:
#import CSV file
df <- read. csv (' my_data.csv ',
colClasses=c(' character '))
#view class of each column in data frame
str(df)
'data.frame': 14 obs. of 3 variables:
$ team: chr "Mavs" "Spurs" "Hornets" "Rockets" ...
$ points: chr "91" "99" "104" "103" ...
$rebounds: chr "33" "23" "26" "25" ...
请注意,结果数据框中的每一列都有一个“字符”类,因为我们只向colClasses参数提供单个值。
请注意,您可以在colClasses参数中指定以下潜在类:
- 角色:“嘿”、“那里”、“世界”
- 复杂: as.complex(-1), 4i
- 数字:as.integer(20), 3L
- 整数:4、12、158
- 逻辑:真、假
其他资源
以下教程解释了如何在 R 中执行其他常见操作: