Bagaimana cara menambahkan kolom hitungan ke bingkai data di r


Anda dapat menggunakan sintaks dasar berikut untuk menambahkan kolom “hitungan” ke bingkai data di R:

 df %>%
  group_by(var1) %>%
  mutate(var1_count = n())

Sintaks khusus ini menambahkan kolom bernama var1_count ke bingkai data yang berisi jumlah nilai dalam kolom bernama var1 .

Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.

Contoh: tambahkan kolom angka di R

Misalkan kita memiliki kerangka data berikut di R yang berisi informasi tentang berbagai pemain bola basket:

 #define data frame
df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'),
                 position=c('G', 'F', 'F', 'F', 'G', 'G', 'F', 'F'),
                 points=c(18, 22, 19, 14, 14, 11, 20, 28))

#view data frame
df

  team position points
1 AG 18
2 AF 22
3 FY 19
4 BF 14
5 BG 14
6 BG 11
7 BF 20
8 BF 28

Kita dapat menggunakan kode berikut untuk menambahkan kolom bernama team_count yang berisi jumlah setiap tim:

 library (dplyr)

#add column that shows total count of each team
df %>%
  group_by(team) %>%
  mutate(team_count = n())

# A tibble: 8 x 4
# Groups: team [2]
  team position points team_count
              
1 AG 18 3
2 AF 22 3
3 FY 19 3
4 BF 14 5
5 BG 14 5
6 BG 11 5
7 BF 20 5
8 BF 28 5

Terdapat 3 baris dengan nilai tim A dan 5 baris dengan nilai tim B.

Jadi:

  • Untuk setiap baris yang teamnya sama dengan A, nilai di kolom team_count adalah 3 .
  • Untuk setiap baris yang teamnya sama dengan B, nilai di kolom team_count adalah 5 .

Anda juga dapat menambahkan kolom “akun” yang mengelompokkan beberapa variabel.

Misalnya, kode berikut menunjukkan cara menambahkan kolom “akun” yang mengelompokkan variabel tim dan posisi :

 library (dplyr)

#add column that shows total count of each team and position
df %>%
  group_by(team, position) %>%
  mutate(team_pos_count = n())

# A tibble: 8 x 4
# Groups: team, position [4]
  team position points team_pos_count
                  
1 AG 18 1
2 AF 22 2
3 FY 19 2
4 BF 14 3
5 BG 14 2
6 BG 11 2
7 BF 20 3
8 BF 28 3

Dari hasilnya kita dapat melihat:

  • Terdapat 1 baris yang berisi A pada kolom tim dan G pada kolom posisi .
  • Terdapat 2 baris yang berisi A pada kolom tim dan F pada kolom posisi .
  • Terdapat 3 baris yang berisi B pada kolom tim dan F pada kolom posisi .
  • Terdapat 2 baris yang berisi B pada kolom tim dan F pada kolom posisi .

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di R:

Cara mengelompokkan dan menghitung dengan kondisi di R
Cara menghitung jumlah elemen dalam daftar di R
Cara memilih satu baris dalam bingkai data di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *