Cara menghitung nilai unik dalam kolom di r


Anda dapat menggunakan metode berikut untuk menghitung jumlah nilai unik dalam kolom bingkai data di R:

Metode 1: Gunakan Basis R

 length(unique(df$my_column))

Metode 2: gunakan dplyr

 library (dplyr)

n_distinct(df$my_column)

Contoh berikut menunjukkan cara menggunakan setiap metode dalam praktik dengan kerangka data berikut:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'C', 'C', 'D'),
                 points=c(10, 13, 14, 14, 18, 19, 20, 20, 22))

#view data frame
df

  team points
1 to 10
2 to 13
3 to 14
4 to 14
5 B 18
6 B 19
7 C 20
8 C 20
9 D 22

Metode 1: Hitung nilai unik di kolom menggunakan basis R

Kode berikut menunjukkan cara menghitung jumlah nilai unik di kolom titik bingkai data menggunakan fungsi dasar R:

 #count unique values in points column
length(unique(df$points))

[1] 7

Terdapat 7 nilai unik pada kolom poin .

Untuk menghitung jumlah nilai unik di setiap kolom bingkai data, kita dapat menggunakan fungsi sapply() :

 #count unique values in each column
sapply(df, function (x) length(unique(x)))

  team points 
     4 7

Dari hasilnya kita dapat melihat:

  • Terdapat 7 nilai unik pada kolom poin .
  • Ada 4 nilai unik di kolom tim .

Metode 2: Hitung nilai unik di kolom menggunakan dplyr

Kode berikut menunjukkan cara menghitung jumlah nilai berbeda pada kolom poin menggunakan fungsi n_distinct() dari paket dplyr:

 library (dplyr)

#count unique values in points column
n_distinct(df$points)

[1] 7

Terdapat 7 nilai unik pada kolom poin .

Untuk menghitung jumlah nilai unik di setiap kolom bingkai data, kita dapat menggunakan fungsi sapply() :

 library (dplyr)

#count unique values in each column
sapply(df, function (x) n_distinct(x))

  team points 
     4 7

Dari hasilnya kita dapat melihat:

  • Terdapat 7 nilai unik pada kolom poin .
  • Ada 4 nilai unik di kolom tim .

Perhatikan bahwa hasil ini cocok dengan metode dasar R.

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di R:

Cara menghitung duplikat di R
Cara menghitung nilai unik berdasarkan grup di R
Cara menghitung banyaknya nilai NA pada setiap kolom di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *