Hoe de modus in r te berekenen (met voorbeelden)
De modus van een dataset vertegenwoordigt de meest voorkomende waarde.
In een gegeven dataset kunnen er geen modi, één enkele modus of meerdere modi zijn.
De R-statistische software heeft geen ingebouwde functie om de modus van een dataset te berekenen, maar u kunt de volgende functie gebruiken om de modus te berekenen:
find_mode <- function (x) { u <- unique(x) tab <- tabulate(match(x, u)) u[tab == max(tab)] }
De volgende voorbeelden laten zien hoe u deze functie in de praktijk kunt gebruiken.
Voorbeeld 1: Berekening van de modus van een digitale vector
De volgende code laat zien hoe u deze functie kunt gebruiken om de modus van een digitale vector te berekenen
#define function to calculate mode
find_mode <- function (x) {
u <- unique(x)
tab <- tabulate(match(x, u))
u[tab == max(tab)]
}
#define numeric vector
data <- c(1, 2, 2, 3, 4, 4, 4, 4, 5, 6)
#find fashion
find_mode(data)
[1] 4
De modus van de dataset blijkt 4 te zijn. Dit is het nummer dat het meest voorkomt.
Merk op dat we deze functie ook kunnen gebruiken als er meerdere modi in een dataset zijn:
#define function to calculate mode
find_mode <- function (x) {
u <- unique(x)
tab <- tabulate(match(x, u))
u[tab == max(tab)]
}
#define numeric vector with multiple modes
data <- c(1, 2, 2, 2, 2, 3, 4, 4, 4, 4, 5, 6)
#find fashion
find_mode(data)
[1] 2 4
De modi van de dataset zijn 2 en 4 . Deze twee cijfers komen het meest voor.
Voorbeeld 2: Berekening van de modus van een karaktervector
Deze functie kan ook worden gebruikt om de modus van een karaktervector te berekenen:
#define function to calculate mode
find_mode <- function (x) {
u <- unique(x)
tab <- tabulate(match(x, u))
u[tab == max(tab)]
}
#define character vector
data <- c('Sunny', 'Cloudy', 'Sunny', 'Sunny', 'Rainy', 'Cloudy')
#find fashion
find_mode(data)
[1] “Sunny”
De modus blijkt “Sunny” te zijn – dit is de string die het vaakst in de vector voorkomt.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere beschrijvende statistieken in R kunt berekenen:
Hoe de samenvatting van vijf getallen in R te berekenen
Hoe u samenvattende tabellen maakt in R
Hoe de Mean()-functie in R te gebruiken