Colclasses を使用してデータを r にすばやくインポートする方法


ファイルを R にインポートするときに、 colClasses引数を使用して、各列のクラスを指定できます。

 df <- read. csv (' my_data.csv ',
               colClasses=c(' character ', ' numeric ', ' numeric '))

ColClassesを使用する利点は、特にファイルが非常に大きい場合に、データをより速くインポートできることです。

次の例は、この引数を実際に使用する方法を示しています。

例: ファイルをインポートする際のcolClassesの使用

R にインポートしたい 3 つの列を含むmy_data.csvという CSV ファイルがあるとします。

これを行うには、次の構文を使用できます。

 #import CSV file
df <- read. csv (' my_data.csv ',
               colClasses=c(' character ', ' numeric ', ' numeric '))

#view class of each column in data frame
str(df)

'data.frame': 14 obs. of 3 variables:
 $ team: chr "Mavs" "Spurs" "Hornets" "Rockets" ...
 $ points: num 91 99 104 103 105 88 89 93 96 99 ...
 $rebounds: num 33 23 26 25 25 26 29 30 34 23 ...

ColClasses引数の値の数は、データ フレーム内の列の数と一致する必要があることに注意してください。

たとえば、 colClasses引数に値を 1 つだけ指定すると、データ フレーム内の各列は同じクラスになります。

 #import CSV file
df <- read. csv (' my_data.csv ',
               colClasses=c(' character '))

#view class of each column in data frame
str(df)

'data.frame': 14 obs. of 3 variables:
 $ team: chr "Mavs" "Spurs" "Hornets" "Rockets" ...
 $ points: chr "91" "99" "104" "103" ...
 $rebounds: chr "33" "23" "26" "25" ...

ColClasses引数に単一の値のみを指定したため、結果として得られるデータ フレームの各列には「文字」クラスがあることに注意してください。

ColClasses引数には次の潜在的なクラスを指定できることに注意してください。

  • 登場人物:「ねえ」、「あそこ」、「世界」
  • 複合体: as.complex(-1)、4i
  • 数値: as.integer(20)、3L
  • 整数: 4、12、158
  • ロジック: TRUE、FALSE

追加リソース

次のチュートリアルでは、R で他の一般的な操作を実行する方法について説明します。

R に生データを手動で入力する方法
CSVファイルをRにインポートする方法
ExcelファイルをRにインポートする方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です