Hoe de modus in r te berekenen (met voorbeelden)


De modus van een dataset vertegenwoordigt de meest voorkomende waarde.

In een gegeven dataset kunnen er geen modi, één enkele modus of meerdere modi zijn.

De R-statistische software heeft geen ingebouwde functie om de modus van een dataset te berekenen, maar u kunt de volgende functie gebruiken om de modus te berekenen:

 find_mode <- function (x) {
  u <- unique(x)
  tab <- tabulate(match(x, u))
  u[tab == max(tab)]
}

De volgende voorbeelden laten zien hoe u deze functie in de praktijk kunt gebruiken.

Voorbeeld 1: Berekening van de modus van een digitale vector

De volgende code laat zien hoe u deze functie kunt gebruiken om de modus van een digitale vector te berekenen

 #define function to calculate mode
find_mode <- function (x) {
  u <- unique(x)
  tab <- tabulate(match(x, u))
  u[tab == max(tab)]
}

#define numeric vector
data <- c(1, 2, 2, 3, 4, 4, 4, 4, 5, 6)

#find fashion
find_mode(data)

[1] 4

De modus van de dataset blijkt 4 te zijn. Dit is het nummer dat het meest voorkomt.

Merk op dat we deze functie ook kunnen gebruiken als er meerdere modi in een dataset zijn:

 #define function to calculate mode
find_mode <- function (x) {
  u <- unique(x)
  tab <- tabulate(match(x, u))
  u[tab == max(tab)]
}

#define numeric vector with multiple modes
data <- c(1, 2, 2, 2, 2, 3, 4, 4, 4, 4, 5, 6)

#find fashion
find_mode(data)

[1] 2 4

De modi van de dataset zijn 2 en 4 . Deze twee cijfers komen het meest voor.

Voorbeeld 2: Berekening van de modus van een karaktervector

Deze functie kan ook worden gebruikt om de modus van een karaktervector te berekenen:

 #define function to calculate mode
find_mode <- function (x) {
  u <- unique(x)
  tab <- tabulate(match(x, u))
  u[tab == max(tab)]
}

#define character vector
data <- c('Sunny', 'Cloudy', 'Sunny', 'Sunny', 'Rainy', 'Cloudy')
#find fashion
find_mode(data)

[1] “Sunny”

De modus blijkt “Sunny” te zijn – dit is de string die het vaakst in de vector voorkomt.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere beschrijvende statistieken in R kunt berekenen:

Hoe de samenvatting van vijf getallen in R te berekenen
Hoe u samenvattende tabellen maakt in R
Hoe de Mean()-functie in R te gebruiken

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert