So berechnen sie den modus nach gruppe in r (mit beispielen)


Der Modus eines Datensatzes stellt den häufigsten Wert dar.

Die R-Statistiksoftware verfügt nicht über eine integrierte Funktion zum Berechnen des Modus eines Datensatzes, Sie können jedoch die folgende Funktion zum Berechnen des Modus verwenden:

 find_mode <- function (x) {
  u <- unique(x)
  tab <- tabulate(match(x, u))
  u[tab == max(tab)]
}

Die folgenden Beispiele zeigen, wie Sie diese Funktion verwenden, um den Modus nach Gruppe in R zu berechnen.

Beispiel 1: Modus nach Gruppe in R berechnen (ein Modus)

Angenommen, wir haben den folgenden Datenrahmen in R, der die von Basketballspielern verschiedener Teams erzielten Punkte zeigt:

 #define data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 points=c(5, 7, 7, 9, 12, 12, 10, 14))

#view data frame
df

  team points
1 to 5
2 to 7
3 to 7
4 to 9
5 B 12
6 B 12
7 B 10
8 B 14

Wir können den folgenden Code verwenden, um den Modus der Punkte , gruppiert nach Team, zu berechnen:

 library (dplyr)

#define function to calculate mode
find_mode <- function (x) {
  u <- unique(x)
  tab <- tabulate(match(x, u))
  u[tab == max(tab)]
}

#calculate mode of 'points' by 'team'
df %>%
  group_by(team) %>%
  summarize(mode_points = find_mode(points))

# A tibble: 2 x 2
  team mode_points
         
1 to 7
2 B 12

Aus den Ergebnissen können wir sehen:

  • Der Punktemodus für Team A ist 7 .
  • Der Punktemodus für Team B ist 12 .

Beispiel 2: Modus nach Gruppe in R berechnen (mehrere Modi)

Angenommen, wir haben den folgenden Datenrahmen in R:

 #define data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 points=c(5, 7, 7, 9, 12, 12, 10, 10))

#view data frame
df

  team points
1 to 5
2 to 7
3 to 7
4 to 9
5 B 12
6 B 12
7 B 10
8 B 10

Wir können den folgenden Code verwenden, um den Modus der Punkte , gruppiert nach Team, zu berechnen:

 library (dplyr)

#define function to calculate mode
find_mode <- function (x) {
  u <- unique(x)
  tab <- tabulate(match(x, u))
  u[tab == max(tab)]
}

#calculate mode of 'points' by 'team'
df %>%
  group_by(team) %>%
  summarize(mode_points = find_mode(points))

# A tibble: 3 x 2
# Groups: team [2]
  team mode_points
         
1 to 7
2 B 12
3 B 10

Aus den Ergebnissen können wir sehen:

  • Der Punktemodus für Team A ist 7 .
  • Die Bewertungsmethode für Team B ist 12 und 10 .

In diesem Beispiel traten zwei Punktwerte am häufigsten für Team B auf. Jeder dieser Moduswerte wird daher in einer separaten Zeile für Team B in der Ausgabe zurückgegeben.

Zusätzliche Ressourcen

Die folgenden Tutorials erklären, wie man andere deskriptive Statistiken in R berechnet:

So berechnen Sie die Zusammenfassung von fünf Zahlen in R
So erstellen Sie Übersichtstabellen in R
So verwenden Sie die Funktion Mean() in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert