Cara menghitung nilai unik dalam kolom di r
Anda dapat menggunakan metode berikut untuk menghitung jumlah nilai unik dalam kolom bingkai data di R:
Metode 1: Gunakan Basis R
length(unique(df$my_column))
Metode 2: gunakan dplyr
library (dplyr)
n_distinct(df$my_column)
Contoh berikut menunjukkan cara menggunakan setiap metode dalam praktik dengan kerangka data berikut:
#create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'C', 'C', 'D'),
points=c(10, 13, 14, 14, 18, 19, 20, 20, 22))
#view data frame
df
team points
1 to 10
2 to 13
3 to 14
4 to 14
5 B 18
6 B 19
7 C 20
8 C 20
9 D 22
Metode 1: Hitung nilai unik di kolom menggunakan basis R
Kode berikut menunjukkan cara menghitung jumlah nilai unik di kolom titik bingkai data menggunakan fungsi dasar R:
#count unique values in points column
length(unique(df$points))
[1] 7
Terdapat 7 nilai unik pada kolom poin .
Untuk menghitung jumlah nilai unik di setiap kolom bingkai data, kita dapat menggunakan fungsi sapply() :
#count unique values in each column
sapply(df, function (x) length(unique(x)))
team points
4 7
Dari hasilnya kita dapat melihat:
- Terdapat 7 nilai unik pada kolom poin .
- Ada 4 nilai unik di kolom tim .
Metode 2: Hitung nilai unik di kolom menggunakan dplyr
Kode berikut menunjukkan cara menghitung jumlah nilai berbeda pada kolom poin menggunakan fungsi n_distinct() dari paket dplyr:
library (dplyr)
#count unique values in points column
n_distinct(df$points)
[1] 7
Terdapat 7 nilai unik pada kolom poin .
Untuk menghitung jumlah nilai unik di setiap kolom bingkai data, kita dapat menggunakan fungsi sapply() :
library (dplyr)
#count unique values in each column
sapply(df, function (x) n_distinct(x))
team points
4 7
Dari hasilnya kita dapat melihat:
- Terdapat 7 nilai unik pada kolom poin .
- Ada 4 nilai unik di kolom tim .
Perhatikan bahwa hasil ini cocok dengan metode dasar R.
Sumber daya tambahan
Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di R:
Cara menghitung duplikat di R
Cara menghitung nilai unik berdasarkan grup di R
Cara menghitung banyaknya nilai NA pada setiap kolom di R