R の列の出現数をカウントする方法


R で次の構文を使用すると、データ フレームの列内の特定の値の出現数をカウントできます。

 #count number of occurrences of each value in column
table(df$column_name)

#count number of occurrences of each value (including NA values) in column
table(df$column_name, useNA = ' always ')

#count number of occurrences of specific value
length(which(df$column_name== value ))

次の例は、次のデータ フレームでこの構文を実際に使用する方法を示しています。

 #create data frame
df <- data. frame (player=c('A', 'B', 'C', 'D', 'E', 'F'),
                 team=c('Mavs', 'Mavs', 'Suns', 'Nets', 'Nets', 'Nets'),
                 points=c(20, 22, 26, 30, 30, NA))

#view data frame
df

  player team points
1 A Mavs 20
2 B Mavs 22
3 C Suns 26
4 D Nets 30
5 E Nets 30
6 F Nets NA

例 1: 列内の値の出現を数える

次のコードは、「チーム」列内の各値の出現数をカウントする方法を示しています。

 #count number of occurrences of each team
table(df$team)

Mavs Nets Suns 
   2 3 1 

これは次のことを示しています。

  • 「マブス」というチーム名が2回出てきます。
  • 「ネッツ」というチーム名が3回出てきます。
  • チーム名「サンズ」が1回登場。

例 2: 列内の値の出現数をカウントする (NA 値を含む)

次のコードは、「ポイント」列内の各値 (NA 値を含む) の出現数をカウントする方法を示しています。

 #count number of occurrences of each value in 'points', including NA occurrences
table(df$points, useNA = ' always ')

  20 22 26 30 <NA>
   1 1 1 2 1

これは次のことを示しています。

  • 値 20 は 1 回表示されます。
  • 値 22 は 1 回現れます。
  • 値 26 は 1 回現れます。
  • 値 30 が 2 回表示されます。
  • NA値(欠損値)は1回出現します。

例 3: 列内の特定の値の出現をカウントします。

次のコードは、「ポイント」列内の値 30 の出現数をカウントする方法を示しています。

 #count number of occurrences of the value 30 in 'points' column
length(which(df$points == 30 ))

[1] 2

これは、値 30 が「ポイント」列に 2 回出現することを示しています。

次の構文を使用して、「ポイント」列内の複数の異なる値の出現数をカウントすることもできます。

 #count number of occurrences of the value 30 or 26 in 'points' column
length(which(df$points == 30 | df$points == 26 ))

[1] 3

これは、値 30 または 26 が「ポイント」列に合計 3 回出現していることを示しています。

追加リソース

R で特定の列を合計する方法
R で複数の列の平均を計算する方法
R の複数の列にわたる最大値を見つける方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です