R'deki bir sütundaki benzersiz değerler nasıl sayılır?
R’deki bir veri çerçevesinin bir sütunundaki benzersiz değerlerin sayısını saymak için aşağıdaki yöntemleri kullanabilirsiniz:
Yöntem 1: Base R’yi kullanın
length(unique(df$my_column))
Yöntem 2: dplyr’ı kullanın
library (dplyr)
n_distinct(df$my_column)
Aşağıdaki örnekler, her yöntemin pratikte aşağıdaki veri çerçevesiyle nasıl kullanılacağını gösterir:
#create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'C', 'C', 'D'),
points=c(10, 13, 14, 14, 18, 19, 20, 20, 22))
#view data frame
df
team points
1 to 10
2 to 13
3 to 14
4 to 14
5 B 18
6 B 19
7 C 20
8 C 20
9 D 22
Yöntem 1: R tabanını kullanarak sütundaki benzersiz değerleri sayın
Aşağıdaki kod, R taban işlevlerini kullanarak veri çerçevesinin nokta sütunundaki benzersiz değerlerin sayısının nasıl sayılacağını gösterir:
#count unique values in points column
length(unique(df$points))
[1] 7
Puan sütununda 7 benzersiz değer bulunmaktadır.
Veri çerçevesinin her sütunundaki benzersiz değerlerin sayısını saymak için sapply() işlevini kullanabiliriz:
#count unique values in each column
sapply(df, function (x) length(unique(x)))
team points
4 7
Sonuçtan şunları görebiliriz:
- Puan sütununda 7 benzersiz değer bulunmaktadır.
- Takım sütununda 4 benzersiz değer vardır.
Yöntem 2: dplyr kullanarak sütundaki benzersiz değerleri sayın
Aşağıdaki kod, dplyr paketindeki n_distinct() işlevini kullanarak puan sütunundaki farklı değerlerin sayısının nasıl sayılacağını gösterir:
library (dplyr)
#count unique values in points column
n_distinct(df$points)
[1] 7
Puan sütununda 7 benzersiz değer bulunmaktadır.
Veri çerçevesinin her sütunundaki benzersiz değerlerin sayısını saymak için sapply() işlevini kullanabiliriz:
library (dplyr)
#count unique values in each column
sapply(df, function (x) n_distinct(x))
team points
4 7
Sonuçtan şunları görebiliriz:
- Puan sütununda 7 benzersiz değer bulunmaktadır.
- Takım sütununda 4 benzersiz değer vardır.
Bu sonuçların temel R yöntemiyle eşleştiğini unutmayın.
Ek kaynaklar
Aşağıdaki eğitimlerde R’de diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:
R’deki kopyalar nasıl sayılır
R’de gruba göre benzersiz değerler nasıl sayılır?
R’deki her sütundaki NA değerlerinin sayısı nasıl sayılır?