So zeichnen sie mehrere boxplots in einem einzigen diagramm in r


Ein Boxplot (manchmal auch Box-and-Whisker-Plot genannt) ist ein Diagramm, das die fünfstellige Zusammenfassung eines Datensatzes zeigt.

Die fünfstellige Zusammenfassung umfasst:

  • Der Mindestwert
  • Das erste Quartil
  • Der Medianwert
  • Das dritte Quartil
  • Der Maximalwert

In diesem Tutorial wird erklärt, wie Sie mit Base R und ggplot2 mehrere Boxplots in einem einzigen Plot in R zeichnen.

R-basierte Boxplots

Um zu veranschaulichen, wie Boxplots in R erstellt werden, arbeiten wir mit dem in R integrierten Luftqualitätsdatensatz :

 #view first 6 rows of "air quality" dataset
head(airquality)

#Ozone Solar.R Wind Temp Month Day
#1 41 190 7.4 67 5 1
#2 36 118 8.0 72 5 2
#3 12 149 12.6 74 5 3
#4 18 313 11.5 62 5 4
#5 NA NA 14.3 56 5 5
#6 28 NA 14.9 66 5 6

Um einen einzelnen Boxplot für die Variable „Ozone“ zu erstellen, können wir die folgende Syntax verwenden:

 #create boxplot for the variable “Ozone”
boxplot(airquality$Ozone)

Dies erzeugt den folgenden Boxplot:

Angenommen, wir möchten stattdessen für jeden Monat im Datensatz ein Boxplot erstellen. Die folgende Syntax zeigt, wie das geht:

 #create boxplot that displays temperature distribution for each month in the dataset
boxplot(Temp~Month,
data=airquality,
main="Temperature Distribution by Month",
xlab="Month",
ylab="Degrees (F)",
col="steelblue",
border="black"
)

Dadurch wird das folgende Diagramm generiert, das für jeden Monat ein Boxplot anzeigt:

Boxplots in ggplot2

Eine andere Möglichkeit, Boxplots in R zu erstellen, ist die Verwendung des Pakets ggplot2 . Für die folgenden Beispiele verwenden wir erneut den integrierten Luftqualitätsdatensatz .

Um ein einzelnes Boxplot für die Variable „Ozon“ im Luftqualitätsdatensatz zu erstellen, können wir die folgende Syntax verwenden:

 #create boxplot for the variable “Ozone”
library(ggplot2)

ggplot(data = airquality, aes(y=Ozone)) + geom_boxplot()

Dies erzeugt den folgenden Boxplot:

Wenn wir stattdessen für jeden Monat im Datensatz ein Boxplot erstellen möchten, können wir dazu die folgende Syntax verwenden:

 #create boxplot that displays temperature distribution for each month in the dataset
library(ggplot2)

ggplot(data = airquality, aes(x=as.character(Month), y=Temp)) +
    geom_boxplot(fill="steelblue") +
    labs(title="Temperature Distribution by Month", x="Month", y="Degrees (F)")

Dadurch wird das folgende Diagramm generiert, das für jeden Monat ein Boxplot anzeigt:

Zusätzliche Ressourcen

Die folgenden Tutorials bieten zusätzliche Informationen zu Boxplots:

Wann sollten Sie einen Boxplot verwenden? (3 Szenarien)
So identifizieren Sie Asymmetrie in Boxplots
So vergleichen Sie Boxplots

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert