R'de gruba göre mod nasıl hesaplanır (örneklerle)


Bir veri kümesinin modu en sık görülen değeri temsil eder.

R istatistiksel yazılımında bir veri kümesinin modunu hesaplamak için yerleşik bir işlev yoktur, ancak modu hesaplamak için aşağıdaki işlevi kullanabilirsiniz:

 find_mode <- function (x) {
  u <- unique(x)
  tab <- tabulate(match(x, u))
  u[tab == max(tab)]
}

Aşağıdaki örnekler, R’de modu gruba göre hesaplamak için bu işlevin nasıl kullanılacağını gösterir.

Örnek 1: R’de modu gruba göre hesaplama (bir mod)

Diyelim ki R’de farklı takımlardan basketbolcuların attığı sayıları gösteren aşağıdaki veri çerçevesine sahibiz:

 #define data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 points=c(5, 7, 7, 9, 12, 12, 10, 14))

#view data frame
df

  team points
1 to 5
2 to 7
3 to 7
4 to 9
5 B 12
6 B 12
7 B 10
8 B 14

Takıma göre gruplandırılmış puan modunu hesaplamak için aşağıdaki kodu kullanabiliriz:

 library (dplyr)

#define function to calculate mode
find_mode <- function (x) {
  u <- unique(x)
  tab <- tabulate(match(x, u))
  u[tab == max(tab)]
}

#calculate mode of 'points' by 'team'
df %>%
  group_by(team) %>%
  summarize(mode_points = find_mode(points))

# A tibble: 2 x 2
  team mode_points
         
1 to 7
2 B 12

Sonuçlardan şunları görebiliriz:

  • A Takımı için puan modu 7’dir .
  • B Takımı için puan modu 12’dir .

Örnek 2: R’de modu gruba göre hesaplama (çoklu modlar)

R’de aşağıdaki veri çerçevesine sahip olduğumuzu varsayalım:

 #define data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 points=c(5, 7, 7, 9, 12, 12, 10, 10))

#view data frame
df

  team points
1 to 5
2 to 7
3 to 7
4 to 9
5 B 12
6 B 12
7 B 10
8 B 10

Takıma göre gruplandırılmış puan modunu hesaplamak için aşağıdaki kodu kullanabiliriz:

 library (dplyr)

#define function to calculate mode
find_mode <- function (x) {
  u <- unique(x)
  tab <- tabulate(match(x, u))
  u[tab == max(tab)]
}

#calculate mode of 'points' by 'team'
df %>%
  group_by(team) %>%
  summarize(mode_points = find_mode(points))

# A tibble: 3 x 2
# Groups: team [2]
  team mode_points
         
1 to 7
2 B 12
3 B 10

Sonuçlardan şunları görebiliriz:

  • A Takımı için puan modu 7’dir .
  • B Takımının puanlama yöntemi 12 ve 10’dur .

Bu örnekte, B Takımı için en sık iki puan değeri ortaya çıkmıştır. Dolayısıyla bu mod değerlerinin her biri, çıktıda B Takımı için ayrı bir satırda döndürülür.

Ek kaynaklar

Aşağıdaki eğitimlerde R’deki diğer tanımlayıcı istatistiklerin nasıl hesaplanacağı açıklanmaktadır:

R’deki beş sayının özeti nasıl hesaplanır
R’de özet tablolar nasıl oluşturulur
R’de Mean() işlevi nasıl kullanılır?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir