R でデータ フレーム列をスタックする方法


多くの場合、2 つ以上のデータ フレーム列を R の 1 つの列にスタックしたい場合があります。

たとえば、次のようなことから始めるとよいでしょう。

 person trial outcome1 outcome2
     A 1 7 4
     A 2 6 4
     B 1 6 5
     B 2 5 5
     C 1 4 3
     C 2 4 2

そのために:

 person trial outcomes value
      A 1 outcome1 7
      A 2 outcome1 6
      B 1 outcome1 6
      B 2 outcome1 5
      C 1 outcome1 4
      C 2 outcome1 4
      A 1 outcome2 4
      A 2 outcome2 4
      B 1 outcome2 5
      B 2 outcome2 5
      C 1 outcome2 3
      C 2 outcome2 2

このチュートリアルでは、これを行うために R で使用できる 2 つの方法について説明します。

方法 1: Base R の Stack 関数を使用する

次のコードは、Base R のstack関数を使用して列をスタックする方法を示しています。

 #create original data frame
data <- data.frame(person=c('A', 'A', 'B', 'B', 'C', 'C'),
                   trial=c(1, 2, 1, 2, 1, 2),
                   outcome1=c(7, 6, 6, 5, 4, 4),
                   outcome2=c(4, 4, 5, 5, 3, 2))

#stack the third and fourth columns
cbind (data[1:2], stack (data[3:4]))

   person trial values ind
1 A 1 7 outcome1
2 A 2 6 outcome1
3 B 1 6 outcome1
4 B 2 5 outcome1
5 C 1 4 outcome1
6 C 2 4 outcome1
7 A 1 4 outcome2
8 A 2 4 outcome2
9 B 1 5 outcome2
10 B 2 5 outcome2
11 C 1 3 outcome2
12 C 2 2 outcome2

方法 2: Reshape2 の Melt 機能を使用する

次のコードは、 reshape2ライブラリのMelt関数を使用して列をスタックする方法を示しています。

 #loadlibrary
library(reshape2)

#create original data frame
data <- data.frame(person=c('A', 'A', 'B', 'B', 'C', 'C'),
                   trial=c(1, 2, 1, 2, 1, 2),
                   outcome1=c(7, 6, 6, 5, 4, 4),
                   outcome2=c(4, 4, 5, 5, 3, 2))

#melt columns of data frame
melt(data, id. var = c(' person ', ' trial '), variable. name = ' outcomes ')

   person trial outcomes value
1 A 1 outcome1 7
2 A 2 outcome1 6
3 B 1 outcome1 6
4 B 2 outcome1 5
5 C 1 outcome1 4
6 C 2 outcome1 4
7 A 1 outcome2 4
8 A 2 outcome2 4
9 B 1 outcome2 5
10 B 2 outcome2 5
11 C 1 outcome2 3
12 C 2 outcome2 2

マージ関数の完全なドキュメントはここで見つけることができます。

追加リソース

Rで2つの列を変更する方法
R で列の名前を変更する方法
R で特定の列を合計する方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です