R'de gruba göre mod nasıl hesaplanır (örneklerle)
Bir veri kümesinin modu en sık görülen değeri temsil eder.
R istatistiksel yazılımında bir veri kümesinin modunu hesaplamak için yerleşik bir işlev yoktur, ancak modu hesaplamak için aşağıdaki işlevi kullanabilirsiniz:
find_mode <- function (x) { u <- unique(x) tab <- tabulate(match(x, u)) u[tab == max(tab)] }
Aşağıdaki örnekler, R’de modu gruba göre hesaplamak için bu işlevin nasıl kullanılacağını gösterir.
Örnek 1: R’de modu gruba göre hesaplama (bir mod)
Diyelim ki R’de farklı takımlardan basketbolcuların attığı sayıları gösteren aşağıdaki veri çerçevesine sahibiz:
#define data frame df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'), points=c(5, 7, 7, 9, 12, 12, 10, 14)) #view data frame df team points 1 to 5 2 to 7 3 to 7 4 to 9 5 B 12 6 B 12 7 B 10 8 B 14
Takıma göre gruplandırılmış puan modunu hesaplamak için aşağıdaki kodu kullanabiliriz:
library (dplyr)
#define function to calculate mode
find_mode <- function (x) {
u <- unique(x)
tab <- tabulate(match(x, u))
u[tab == max(tab)]
}
#calculate mode of 'points' by 'team'
df %>%
group_by(team) %>%
summarize(mode_points = find_mode(points))
# A tibble: 2 x 2
team mode_points
1 to 7
2 B 12
Sonuçlardan şunları görebiliriz:
- A Takımı için puan modu 7’dir .
- B Takımı için puan modu 12’dir .
Örnek 2: R’de modu gruba göre hesaplama (çoklu modlar)
R’de aşağıdaki veri çerçevesine sahip olduğumuzu varsayalım:
#define data frame df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'), points=c(5, 7, 7, 9, 12, 12, 10, 10)) #view data frame df team points 1 to 5 2 to 7 3 to 7 4 to 9 5 B 12 6 B 12 7 B 10 8 B 10
Takıma göre gruplandırılmış puan modunu hesaplamak için aşağıdaki kodu kullanabiliriz:
library (dplyr)
#define function to calculate mode
find_mode <- function (x) {
u <- unique(x)
tab <- tabulate(match(x, u))
u[tab == max(tab)]
}
#calculate mode of 'points' by 'team'
df %>%
group_by(team) %>%
summarize(mode_points = find_mode(points))
# A tibble: 3 x 2
# Groups: team [2]
team mode_points
1 to 7
2 B 12
3 B 10
Sonuçlardan şunları görebiliriz:
- A Takımı için puan modu 7’dir .
- B Takımının puanlama yöntemi 12 ve 10’dur .
Bu örnekte, B Takımı için en sık iki puan değeri ortaya çıkmıştır. Dolayısıyla bu mod değerlerinin her biri, çıktıda B Takımı için ayrı bir satırda döndürülür.
Ek kaynaklar
Aşağıdaki eğitimlerde R’deki diğer tanımlayıcı istatistiklerin nasıl hesaplanacağı açıklanmaktadır:
R’deki beş sayının özeti nasıl hesaplanır
R’de özet tablolar nasıl oluşturulur
R’de Mean() işlevi nasıl kullanılır?