R で fread() を使用してファイルをより速くインポートする方法


R のdata.tableパッケージのfread()関数を使用すると、ファイルを迅速かつ簡単にインポートできます。

この関数は次の基本構文を使用します。

 library (data.table)

df <- fread(" C:\\Users\\Path\\To\\My\\data.csv ")

大きなファイルの場合、この関数は、ベース R のread.csvなどの関数よりも大幅に高速であることがわかりました。

また、ほとんどの場合、この関数は、インポートするデータセットの区切り文字と列のタイプを自動的に検出することもできます。

次の例は、この関数を実際に使用する方法を示しています。

例: feed() を使用してファイルを R にインポートする方法

data.csvという CSV ファイルが次の場所に保存されているとします。

C:\ユーザー\ボブ\デスクトップ\data.csv

CSV ファイルには次のデータが含まれていると仮定します。

 team, points, assists
'A', 78, 12
'B', 85, 20
'C', 93, 23
'D', 90, 8
'E', 91, 14

data.tableパッケージのfread()関数を使用して、このファイルを現在の R 環境にインポートできます。

 library (data.table)

#import data
df <- fread("C:\Users\Bob\Desktop\data.csv")

#viewdata
df

  team points assists
1 A 78 12
2 B 85 20
3 C 93 23
4 D 90 8
5 E 91 14

fread()関数を使用して CSV ファイルを正常にインポートできます。

: 一般的なインポート エラーを回避するために、ファイル パスに二重バックスラッシュ (\\) を使用しました。

fread()関数がカンマであることを自動的に検出したため、区切り文字を指定する必要もなかったことにも注意してください。

str()関数を使用してデータ フレームの構造を表示すると、 fread()関数が各列のオブジェクト タイプも自動的に識別していることがわかります。

 #view structure of data
str(df)

Classes 'data.table' and 'data.frame': 5 obs. of 3 variables:
 $ team: chr "'A'" "'B'" "'C'" "'D'" ...
 $points: int 78 85 93 90 91
 $assists: int 12 20 23 8 14

結果から次のことがわかります。

  • チーム変数は文字です。
  • ポイント変数は整数です。
  • ヘルパー変数は整数です。

この例では、簡単にするために小さなデータ フレーム (5 行 x 3 列) を使用しましたが、実際にはfread()関数を使用すると、数万行を含むデータ ブロックを迅速かつ効率的にインポートできるため、推奨されるインポート方法になります。大規模なデータセットの場合。

追加リソース

次のチュートリアルでは、特定のファイル タイプを R にインポートする方法について説明します。

ExcelファイルをRにインポートする方法
TSVファイルをRにインポートする方法
Zip ファイルを R にインポートする方法
SAS ファイルを R にインポートする方法
.dta ファイルを R にインポートする方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です